概述:

YoloWorld-EfficientSAM是一款轻量级语义分割工具,专为高效识别和区分图像或视频中不同对象和区域而设计的算法软件。它能够在复杂的视觉场景中,自动标注和区分出多种元素,如人物、车辆、建筑物、道路、植被等。

如何安装:

下载地址:https://github.com/ZHO-ZHO-ZHO/ComfyUI-YoloWorld-EfficientSAM?tab=readme-ov-file

依赖安装:

pip install -r requirements.txt

语义分割模型下载:

下载地址:https://huggingface.co/camenduru/YoloWorld-EfficientSAM/tree/main

模型: efficient_sam_s_cpu.jit和efficient_sam_s_gpu.jit

安装目录:custom_nodes/ComfyUI-YoloWorld-EfficientSAM(直接放在YoloWorld-EfficientSAM这款插件的目录下,它没有专门的模型文件夹)

其他模型:

YOLO-World 模型:yolo_world/l, yolo_world/m, yolo_world/s,会自动下载并加载

节点说明

  • YOLO-World 模型加载 | Yoloworld Model Loader

    • 支持 3 种官方模型:yolo_world/l, yolo_world/m, yolo_world/s,会自动下载并加载
  • EfficientSAM 模型加载 | ESAM Model Loader

    • 支持 CUDA 或 CPU
  • 检测 + 分割 | Yoloworld ESAM

    • yolo_world_model:接入 YOLO-World 模型
    • esam_model:接入 EfficientSAM 模型
    • image:接入图像
    • categories:检测 + 分割内容
    • confidence_threshold:置信度阈值,降低可减少误检,增强模型对所需对象的敏感性。增加可最小化误报,防止模型识别不应识别的对象
    • iou_threshold:IoU 阈值,降低数值可减少边界框的重叠,使检测过程更严格。增加数值将会允许更多的边界框重叠,适应更广泛的检测范围
    • box_thickness:检测框厚度
    • text_thickness:文字厚度
    • text_scale:文字缩放
    • with_confidence:是否显示检测对象的置信度
    • with_class_agnostic_nms:是否抑制类别之间的重叠边界框
    • with_segmentation:是否开启 EfficientSAM 进行实例分割
    • mask_combined:是否合并(叠加)蒙版 mask,”是”则将所有 mask 叠加在一张图上输出,”否”则会将所有的蒙版单独输出
    • mask_extracted:是否提取选定蒙版 mask,”是”则会将按照 mask_extracted_index 将所选序号的蒙版单独输出
    • mask_extracted_index:选择蒙版 mask 序号
  • 检测 + 分割 | Yoloworld ESAM Detector Provider

    • 可配合 Impact-Pack 一起使用
    • yolo_world_model:接入 YOLO-World 模型
    • esam_model:接入 EfficientSAM 模型
    • categories:检测 + 分割内容
    • iou_threshold:IoU 阈值
    • with_class_agnostic_nms:是否抑制类别之间的重叠边界框

使用方法:

如有疑问可联系:wxmm19950101
1、本站AI工具使用教程全免费,并且持续更新
2、如果你想看一些例子或者学更多东西,需要花每年128元成为普通会员。
3、对于更专业的商业案例,你需要花599元成为高级会员才能看到。
😊 立刻申请会员😊 →