解锁图像风格迁移:深入探讨 ControlNet 和 IPAdapter 工作流
解锁 AI 驱动的图像风格迁移与重绘功能,使用 ControlNet、IPAdapter 和 LoRA。探索一个能够生成惊艳图像,同时保留原始内容和结构的工作流。了解更多内容,提升你的图像创作!
- 显存
- 低显存(≤8GB)
- 阅读时间
- 6 分钟
工作流概览
解锁 AI 驱动的图像风格迁移与重绘功能,使用 ControlNet、IPAdapter 和 LoRA。探索一个能够生成惊艳图像,同时保留原始内容和结构的工作流。了解更多内容,提升你的图像创作!
内容类型: Workflow
主要用途: Download
所需模型
- Controlnet
- Lora
- Sd
所需节点
- Ipadapter
- Controlnet
配置说明
- 打开工作流模板前,请先安装所需模型。
- 推荐硬件:低显存(≤8GB)。
工作流概述

这个工作流的主要目的是通过多种技术手段(如 ControlNet、IPAdapter、LoRA 等)实现图像风格迁移和重绘。它能够根据输入的图像和提示词,生成具有特定风格的图像,同时保留原始图像的结构和内容。工作流的核心是通过多个 ControlNet 模型和 IPAdapter 来实现对图像风格和内容的精确控制。
核心模型
工作流中使用了以下核心模型:
ControlNet:用于控制生成图像的结构和内容,支持多种预处理器(如 OpenPose、Depth、Canny 等)。
IPAdapter:用于图像风格迁移,能够将参考图像的风格应用到生成图像中。
LoRA:低秩适应模型,用于微调生成图像的风格和细节。
Stable Diffusion:基础的图像生成模型,负责根据提示词和条件生成图像。
组件说明
工作流中的关键组件(Nodes)包括:
LoadImage:加载输入图像和参考图像。
ControlNetLoader:加载 ControlNet 模型,支持多种预处理器。
IPAdapterModelLoader:加载 IPAdapter 模型,用于风格迁移。
CLIPVisionLoader:加载 CLIP 视觉模型,用于图像编码。
BrushNetLoader:加载 BrushNet 模型,用于图像重绘。
ControlNetApplySD3:应用 ControlNet 模型,控制生成图像的结构。
IPAdapterAdvanced:应用 IPAdapter 模型,实现风格迁移。
KSampler (Efficient):高效的采样器,用于生成图像。
VAEDecode:将潜在空间图像解码为可视图像。
PreviewImage:预览生成的图像。
安装方法:
ControlNet、IPAdapter、LoRA 等组件需要通过 ComfyUI Manager 或 GitHub 安装相应的插件。例如:
ControlNet 插件:
ComfyUI_ControlNetIPAdapter 插件:
ComfyUI_IPAdapter_plusLoRA 插件:
ComfyUI_Comfyroll_CustomNodes
依赖的特殊模型:
ControlNet 模型(如
control_v11p_sd15_openpose、control_v11f1p_sd15_depth等)需要从 Hugging Face 或其他模型仓库下载。IPAdapter 模型(如
ip-adapter_sd15_plus)也需要从相应的仓库下载。
工作流结构
工作流可以分为以下几个主要部分:
图像加载组:
LoadImage:加载输入图像和参考图像。
输入:图像文件路径(如
image.png)。输出:加载的图像数据,供后续节点使用。
ControlNet 控制组:
多个 ControlNetLoader 和 ControlNetApplySD3 节点,分别加载和应用不同的 ControlNet 模型(如 OpenPose、Depth、Canny 等)。
输入:从 LoadImage 节点传递的图像数据。
输出:经过 ControlNet 处理的条件图像。
风格迁移组:
IPAdapterModelLoader 和 IPAdapterAdvanced 节点,加载和应用 IPAdapter 模型,实现风格迁移。
输入:参考图像和生成模型。
输出:具有参考图像风格的生成图像。
图像生成组:
KSampler (Efficient) 和 VAEDecode 节点,生成并解码图像。
输入:经过 ControlNet 和 IPAdapter 处理的条件图像。
输出:最终生成的图像。
提示词处理组:
CLIPTextEncode 和 SDXLPromptStyler 节点,处理提示词并生成条件向量。
输入:文本提示词。
输出:编码后的条件向量,用于生成图像。
输入与输出
输入:
图像文件路径(如
image.png)。文本提示词(如
1girl, solo, brown_hair)。参考图像(用于风格迁移)。
输出:
生成的图像,保存为 PNG 或 JPG 格式。
注意事项
模型下载:确保所有使用的模型(如 ControlNet、IPAdapter、LoRA 等)已正确下载并放置在 ComfyUI 的模型目录中。
性能需求:由于同时运行多个模型(如 ControlNet、IPAdapter 等),可能需要较高的 GPU 显存,建议使用至少 8GB 显存的 GPU。
提示词优化:提示词的质量直接影响生成图像的效果,建议使用详细的描述词。
兼容性:确保使用的 ComfyUI 版本与工作流中的组件兼容。