解锁无瑕图像:AI驱动的水印去除工作流

CN
ComfyUI.org
2025-04-03 10:30:36

使用 AI 驱动的工作流自动去除水印:利用 Florence2 或 GroundingDINO + SAM 检测水印,调整掩码,并使用 Stable Diffusion 进行图像修复。

模型
Sd
关键节点
Inpaint
阅读时间
6 分钟
查看所需模型

工作流概览

使用 AI 驱动的工作流自动去除水印:利用 Florence2 或 GroundingDINO + SAM 检测水印,调整掩码,并使用 Stable Diffusion 进行图像修复。

内容类型: Workflow

主要用途: Download

所需模型

  • Sd

所需节点

  • Inpaint

配置说明

  • 打开工作流模板前,请先安装所需模型。

1. 工作流概述

m917u5gqkn77h57eiqbb04e38c71e1b242a5de5ef3f883fa60acfdc9235abda6272f0b78d5b048b8efd.gif

该工作流主要用于 自动或半自动去除图像中的水印和Logo,支持两种不同的识别模块(Florence2 和 GroundingDINO + SAM),并允许用户手动调整遮罩。最终输出修复后的图像,并提供对比视图。


2. 核心模型

模型

功能

来源

Florence2

基于微软的OCR+区域检测模型,擅长识别文字和Logo区域

microsoft/Florence-2-large (HuggingFace)

GroundingDINO

目标检测模型,用于定位水印/Logo

GroundingDINO_SwinB (GitHub)

SAM (Segment Anything)

分割模型,生成精细遮罩

sam_vit_h_4b8939.pth (Meta AI)

Stable Diffusion (Inpainting)

图像修复,填充去除水印后的区域

realisticVisionV60B1 或其他SD模型


3. 关键组件

(1) 图像加载与预处理

  • LoadImage:加载输入图像(如 水印图片-1.png)。

  • ImageScaleByAspectRatio:调整图像分辨率(如 1024x1024),保持比例。

(2) 水印检测模块

模块1: Florence2 (OCR+区域检测)

  • Florence2ModelLoader:加载Florence2模型(需HuggingFace token)。

  • Florence2Run:运行检测,输出遮罩和文字信息。

模块2: GroundingDINO + SAM

  • GroundingDinoSAMSegment:结合DINO(检测)和SAM(分割),生成遮罩。

  • GrowMaskWithBlur:扩展遮罩边缘,使修复更自然。

(3) 图像修复

  • InpaintCrop:裁剪待修复区域。

  • KSampler:使用Stable Diffusion模型(如 realisticVisionV60B1)修复图像。

  • InpaintStitch:将修复后的区域缝合回原图。

(4) 输出与对比

  • SaveImage:保存最终结果。

  • Image Comparer:对比处理前后效果(滑动视图)。


4. 工作流结构

Group 1: 输入与预处理

  • 输入:图像文件(如PNG/JPG)。

  • 输出:调整大小后的图像。

Group 2: 水印检测(双模块)

  • 输入:缩放后的图像。

  • 输出:遮罩(Mask)。

Group 3: 修复与缝合

  • 输入:遮罩 + 原始图像。

  • 输出:修复后的图像。

Group 4: 结果对比

  • 输入:原始图 vs 修复图。

  • 输出:并排对比视图。


5. 输入与输出

输入参数

  1. 图像文件(如 水印图片-1.png)。

  2. 模型选择(Florence2 或 GroundingDINO+SAM)。

  3. 修复参数(如采样步数 20、CFG 1)。

输出结果

  • 修复后的图像(无水印版本)。

  • 对比视图(可选)。


6. 注意事项

安装依赖

  1. Florence2:需HuggingFace账号和API token。

    pip install transformers
  2. GroundingDINO + SAM

    • 从GitHub安装:

      git clone https://github.com/IDEA-Research/GroundingDINO
      git clone https://github.com/facebookresearch/segment-anything
    • 下载模型权重(如 sam_vit_h_4b8939.pth)。

  3. ComfyUI 插件

    • 通过 ComfyUI Manager 安装:

      • rgthree Nodes(用于上下文管理)。

      • LayerUtility(图像缩放)。

常见问题

  • CUDA内存不足:降低分辨率或使用 --medvram 参数启动ComfyUI。

  • 模型加载失败:检查权重文件路径是否正确。

  • 遮罩不准确:手动调整 GrowMaskWithBlur 参数(如 扩张像素=5)。

性能建议

  • 使用 RTX 3090/4090 或更高GPU以获得最佳速度。

  • 对4K图像,建议先缩放到 1024x1024 再处理。


7. 总结

该工作流适合需要批量去水印的用户,结合了 自动化检测+手动微调 的优势。Florence2适合文字水印,而GroundingDINO+SAM更适合图形Logo。修复质量依赖Stable Diffusion模型的选择(如 realisticVision 适合照片,revAnimated 适合动漫)。


提示:首次运行时,建议先测试小图并逐步调整遮罩参数!

常见问题