全面升级你的视觉创作:修复、风格迁移、自动字幕,一站搞定!
解锁高级图像编辑:探索一套基于 SDXL 的强大工作流程,结合 DreamShaper XL 和 ControlNet 等 AI 模型,实现图像修复、风格迁移与自动字幕生成。
- 显存
- 中等显存(12–16GB)
- 阅读时间
- 4 分钟
工作流概览
解锁高级图像编辑:探索一套基于 SDXL 的强大工作流程,结合 DreamShaper XL 和 ControlNet 等 AI 模型,实现图像修复、风格迁移与自动字幕生成。
内容类型: Workflow
主要用途: Download
所需模型
- Sdxl
- Controlnet
所需节点
- Ipadapter
- Controlnet
配置说明
- 打开工作流模板前,请先安装所需模型。
- 推荐硬件:中等显存(12–16GB)。
1. 工作流概述

这是一个基于 Stable Diffusion XL (SDXL) 的 图像修复与风格迁移工作流,主要用于:
局部重绘:修复图像中的缺陷或移除不需要的元素(如水印、瑕疵)。
风格迁移:通过 IPAdapter 和 ControlNet 将参考图像的风格应用到目标图像。
智能反推:使用 Meta-Llama-3 模型自动生成图像描述(Caption),辅助生成更精准的提示词。
2. 核心模型
模型名称 | 功能说明 |
|---|---|
DreamShaper XL v2.1 Turbo | 主模型,用于高质量图像生成(需手动下载并放置到 |
xinsir_controlnet_depth_sdxl | ControlNet 模型,用于控制图像结构和深度(需单独下载)。 |
IPAdapter (PLUS) | 实现风格迁移,将参考图像特征注入生成过程(需安装 |
MAT_Places512_G_fp16 | 局部重绘专用模型,优化修复效果(需放置到 |
3. 关键组件(Nodes)
组件名称 | 功能说明 | 安装方式 |
|---|---|---|
| 加载 Fooocus 专用修复模型 | 通过 ComfyUI Manager 安装 |
| 高级风格迁移控制 | 需安装 |
| 应用 ControlNet 深度控制 | 内置节点(需下载对应模型) |
| 使用 Llama-3 反推图像描述 | 需安装 |
| 自动计算最佳重绘分辨率 | 内置节点 |
特殊依赖:
IPAdapter 模型:需下载
ip-adapter-plus_sdxl_vit-h.bin并放置到models/ipadapter。ControlNet 模型:需下载
xinsir_controlnet_depth_sdxl_1.0.safetensors到models/controlnet。
4. 工作流结构
Group 1: 反推
输入:原始图像(通过
LoadImage加载)。输出:图像描述文本(用于生成提示词)。
关键节点:
Joy_caption_load、Joy_caption。
Group 2: 预处理
输入:原始图像 + 遮罩。
输出:裁剪后的图像和扩展的遮罩区域。
关键节点:
CutForInpaint、GrowMask。
Group 3: 重绘与风格迁移
输入:预处理图像 + ControlNet 深度图 + IPAdapter 参考图。
输出:修复后的图像。
关键节点:
KSampler、IPAdapterAdvanced、INPAINT_ApplyFooocusInpaint。
Group 4: 后处理与对比
输入:原始图像和修复结果。
输出:混合修复后的最终图像(
BlendInpaint)和对比视图(Image Comparer)。
5. 输入与输出
输入参数:
图像:需包含遮罩(标记需修复区域)。
分辨率:默认
2048x2048(通过PixelPerfectResolution自动优化)。提示词:可通过
Joy_caption自动生成或手动输入。
输出结果:修复后的图像(PNG),支持与原图对比查看。
6. 注意事项
显存需求:建议 ≥12GB GPU 显存(SDXL + ControlNet + IPAdapter 较耗资源)。
常见错误:
缺少模型文件时,ComfyUI 会显示红色错误框,需检查模型路径。
遮罩未正确覆盖修复区域会导致生成异常。
性能优化:
启用
xformers加速生成。降低
KSampler的步数(如从 30 降至 20)以减少计算时间。