comfy.hebolide.com

workflow

探索惊艳图像创作流程：基于Flux.1的文本到图像生成

SUPIR-8K壁纸级放大逐步指南

让您的照片动起来：利用Sonic Diffusion和NTCosyVoice实现AI驱动的视频生成

探索水彩风格图片创作过程

探索艺术图像生成的完整工作流程

揭秘敖闰：革命性的中国神话艺术创作流程

探索终极东方艺术创作流程与AI的结合

“释放艺术潜力：深入探索 Flux.1 和 Florence-2 工作流程”

探索宫崎骏风格电影分镜图像创作流程

探索多高质量图片的创作流程

一键抠图：ComfyUI的CLIP与AWPainting模型图像生成指南

探索水彩插画创作工作流程

探索图片无缝换脸创作流程

突破画框：FLUX 模型图像扩展的逐步工作流程

掌握背景替换的艺术：逐步AI工作流程

打造惊艳角色艺术：北欧精灵肖像的逐步指南

重拾记忆：AI 驱动的老照片修复变得简单

利用Stable Diffusion、JOY Caption Two和LORA提升您的图像生成技艺

复兴的艺术：运用AI技术从绘画和雕塑中修复历史肖像

解锁惊艳视觉效果：Stable Diffusion工作流程的逐步指南

探索国潮艺术创作工作流程

轻松创建惊艳动画视频：Flux.1与WanVideo教程

解锁专业级海报设计：运用Miluo高级美学工作流程

探索Flux室内设计工作流程

从真实到动漫：深入解析高级图像变换工作流程

从文本到视频：WanVideo 与 ControlNet 如何改变游戏规则

解锁惊艳建筑视觉效果：探索Stable Diffusion XL工作流程

解锁视频换脸：掌握ReActor与RIFE，成就专业视频编辑

解锁图像风格迁移：深入探讨 ControlNet 和 IPAdapter 工作流

轻松去除背景：ComfyUI工作流的逐步指南

探索 AI 自动转换线条图的工作流程

🚀 使用 AI 将您的照片转化为惊艳的二次元杰作！

解锁逼真的人像照片：利用 AI 技术将卡通图片转化为真实照片

解锁梦幻云朵场景：工作流逐步部署指南

利用ComfyUI的尖端工作流程提升纹理与皮肤真实感

探索生成参考图同类图片工作流程

肖像编辑的未来：驾驭ControlNet与LoRA模型

探索中国古风手绘艺术创作流程

解锁电影级人像：使用高级 ComfyUI 工作流打造背光杰作！

焕新你的视频：AI 驱动的帧级修复与增强

释放视频转动画的力量：全面流程指南

用AI焕新您的产品图片：全流程指南

探索精准图像生成工作流程

解锁春季活力：将文字转化为惊艳的3D艺术作品

掌握深度控制与风格迁移，尽在这款前沿流程

实现无与伦比的图像质量：减少AI伪影的专家级工作流

通过FLUX和差分扩散解锁无缝图像修复

使用AI驱动的FLUX解锁中国水墨画的奥秘

从照片到杰作：利用AI将单张照片转化为多场景作品

探索照片转素描的工作流程

解锁动漫艺术大师级创作：自动上色工作流揭秘

解锁动漫风格视频魔法：WAN2.1逐步工作流指南

解锁高效角色图像创作：全面工作流指南

探索超真实皮肤质感图片创作流程

掌握图像修饰：电商领域的全面工作流

解锁惊艳人像：高级AI工作流揭秘

使用AI驱动的工作流解锁可自定义的卡通表情包

解锁完美手部修复：AI驱动工作流揭秘

使用高级AI流水线解锁专业级角色与场景融合

通过IPAdapterFaceIDKolors与ControlNet解锁真实材质迁移

从概念到现实：掌握渐进式去噪与超分辨率技术

解锁线稿转化为3D风格渲染工作流程

从图像到视频：深入解析Wan2.1-I2V工作流

解锁文本生成视频的强大能力：阿里巴巴Wanx-8G模型解析

极简杰作：AI驱动的渐变风格艺术工作流

解锁3D魔法：将2D线稿转换为3D的逐步工作流程

解锁文本生成视频的强大能力，体验阿里云Wan2.1模型

探索对口型同步的卡通头像视频工作流程

通过基于 Wan 模型的工作流程解锁高级视频深度控制

终极视频生成管道：功能、模型与优化

使用先进的AI模型，将您的视频转换为动漫风格的杰作

使用 DeepSeek-R1 32B LLM 解锁专业级 AI 艺术提示词！

解锁无瑕图像：AI驱动的水印去除工作流

改造您的产品图片：高级风格迁移与合成技术

解锁专业证件照制作工作流程

解锁惊艳的60帧视频：全面工作流程指南

解锁惊艳的视频生成与风格控制：全面工作流程指南

探索使用 PulID Flux 生成 3D 虚拟头像的工作流程

提升视觉表达力：面向专业人士的 Wan2.1 视频生成工作流

掌握视频创作：首帧/末帧生成与增强工作流

探索生成烹饪猫咪视频的工作流程

利用AI技术将您的视频转化为风格化动画

通过AI驱动的视频生成，解锁360度产品动画

从原始到精细：通过先进模型掌握图像处理技巧

借助 Flux Diffusion 和 Janus AI，实现无缝图像扩展

揭开历史面纱：将古代绘画转化为超现实照片

借助 Flux Diffusion 和多重条件引导，实现精准的 AI 图像编辑

释放 WanVideo 的强大功能：制作惊艳的贴纸撕裂效果视频

释放 AI 驱动的视频角色重绘能力：用风格化效果焕新视频画面

解锁电影级画质掌控力：超高清摄影工作流程揭秘

解锁专业级人像编辑：AI 驱动的工作流程助你轻松上手

解锁 AI 视频生成的强大力量：全面工作流程指南

绽放之美：建筑花开特效的技术指南

古韵之美生成揭秘：Stable Diffusion 搭配 SUPIR 的强强联合

释放创意视频生成力：运用 LoRA 特效实现物品装入礼盒的视觉效果

借助 Wan2.1、RIFE 与 CR 超分辨率，全面提升你的视频创作能力

解锁高效图像生成：全流程工作指南

从照片到艺术杰作：结合 ControlNet 与 LoRA 的风格化图像生成工作流程

探索 AI 艺术生成的魔力：一步步教你掌握完整工作流程

探索古代中国美人图片创作流程

利用Stable Diffusion、JOY Caption Two和LORA提升您的图像生成技艺

CN

ComfyUI.org

2025-03-17 08:59:45

解锁由AI驱动的图像生成技术，借助Stable Diffusion、JOY Caption Two和FLUX。探索如何从参考图像逆向工程提示，并创造出令人惊叹的新视觉效果。了解更多信息，立即开始创作吧！

模型: Flux
Lora
Sd
显存: 低显存（≤8GB）
阅读时间: 7 分钟

查看所需模型

工作流概览

解锁由AI驱动的图像生成技术，借助Stable Diffusion、JOY Caption Two和FLUX。探索如何从参考图像逆向工程提示，并创造出令人惊叹的新视觉效果。了解更多信息，立即开始创作吧！

内容类型: Workflow

主要用途: Download

所需模型

Flux
Lora
Sd

配置说明

打开工作流模板前，请先安装所需模型。
推荐硬件：低显存（≤8GB）。

📝 工作流概述（Workflow Overview）

m8cu4417aph1otfmu1l截屏2025-03-11 13.13.23 (1).png

本工作流的主要作用是 基于参考图进行反推提示词，并使用 Stable Diffusion 生成新图。它结合了 JOY Caption Two 反推提示词 和 FLUX 及 LORA 模型的增强，最终生成高质量的图像，并对比输入图和生成图的效果。

🧠 核心模型（Core Models）

1️⃣ UNet（Stable Diffusion）

作用：图像生成的主要神经网络，负责去噪并生成最终图像。
使用的模型：基础算法_F.1
安装方式：
- 通过 ComfyUI Manager 安装 SD 相关模型。
- 或者手动下载 .safetensors 文件放入 models/checkpoints。

2️⃣ VAE（变分自编码器）

作用：用于提升图像的质量，特别是细节和色彩部分。
使用的模型：ae.sft
安装方式：
- 通过 ComfyUI Manager 安装 VAE 模型。
- 或者手动下载 .vae.pt 文件放入 models/vae。

3️⃣ CLIP（文本编码器）

作用：将文本提示词转换为可用于图像生成的向量。
使用的模型：t5xxl_fp8_e4m3fn
安装方式：
- 通过 ComfyUI Manager 下载 CLIP 模型。
- 或者手动下载 .pt 文件放入 models/clip。

4️⃣ JOY Caption Two（提示词反推）

作用：对输入图像进行描述，反推出适用于生成的新提示词。
使用的模型：unsloth/Meta-Llama-3.1-8B-Instruct-bnb-4bit
安装方式：
- 需要额外下载 JOY Caption Two 插件，并安装 Llama 3.1 模型。

5️⃣ LORA（风格增强）

作用：用于增强特定风格，如 中国新年主题 或 花样美蛇。
使用的模型：
- J_3D图标素材2_中国新年_V_Flux
- 趣味-F.1- | 花样美蛇_V1
安装方式：
- 通过 ComfyUI Manager 下载 LORA 模型。
- 或者手动放入 models/lora 文件夹。

📦 关键组件（Nodes）

节点	作用
`UNETLoader`	加载 UNet 模型
`VAELoader`	加载 VAE 变分自编码器
`DualCLIPLoader`	加载 CLIP 语言模型
`LoraLoaderModelOnly`	加载 LORA 风格模型
`LoadImage`	加载参考图
`ImageResizeKJ`	调整图像尺寸
`Joy_caption_two_load`	加载 JOY Caption Two 反推模型
`Joy_caption_two`	对输入图像生成描述文本
`ShowText`	显示反推的提示词
`CLIPTextEncode`	将提示词转换为向量
`KSampler`	负责采样和生成图像
`VAEEncode`	将输入图转换为潜空间
`VAEDecode`	将潜空间转换为最终图像
`SaveImage`	保存最终输出的图像
`Image Comparer (rgthree)`	用于对比输入图和生成图

📂 主要分组（Workflow Groups）

1️⃣ JOY Caption Two - 提示词反推

作用：使用 JOY Caption Two 反推出适用于输入图像的描述性提示词。
关键组件：
- Joy_caption_two_load
- Joy_caption_two
- ShowText
输入：图像
输出：描述性文本（用于 Stable Diffusion）

2️⃣ 基础模型加载

作用：加载 UNet、VAE、CLIP 基础模型。
关键组件：
- UNETLoader
- VAELoader
- DualCLIPLoader

3️⃣ 参考图输入

作用：加载用户提供的参考图像并调整大小。
关键组件：
- LoadImage
- ImageResizeKJ

4️⃣ LORA 模型选择

作用：选择 LORA 进行风格增强。
关键组件：
- LoraLoaderModelOnly

5️⃣ 提示词反推结果输入

作用：将 JOY Caption Two 生成的文本输入 CLIP 进行编码，供 Stable Diffusion 生成使用。
关键组件：
- CLIPTextEncode
- ConditioningZeroOut

6️⃣ 图像输出

作用：通过 UNet 和 VAE 生成最终图像并保存。
关键组件：
- KSampler
- VAEDecode
- SaveImage

7️⃣ 图像对比

作用：将原始图像与生成图像进行对比。
关键组件：
- Image Comparer (rgthree)

🔢 输入 & 输出

📥 主要输入参数

参考图像（用于反推提示词）
LORA 选择（增强特定风格）
采样参数：
- 种子值（随机性控制）
- 采样方法（Euler、DPM++等）
- 采样步数（默认 25 步）
文本提示词（通过 JOY Caption Two 生成）

📤 主要输出

最终生成的高质量图像
反推的描述性文本
对比输入图像和生成图像的结果

⚠️ 使用注意事项

计算资源需求
- 需要 至少 8GB GPU（推荐 12GB 以上）。
- JOY Caption Two 可能占用较大显存，建议使用 4-bit 量化模型。
LORA 模型兼容性
- 不同 LORA 可能会影响生成结果，建议尝试不同组合以获得最佳效果。
提示词优化
- 反推的提示词可能需要手动调整，以获得更符合预期的结果。
采样参数
- 采样步数过低可能导致细节缺失，建议 25~50 步。
- Euler 采样器较快，DPM++ 可能提供更高质量。

总结

这个 ComfyUI 工作流通过 JOY Caption Two 反推提示词，结合 LORA 风格模型 和 Stable Diffusion 进行高质量图像生成，并提供图像对比功能。适合 图像编辑、风格化设计 以及 AI 生成艺术。

常见问题

重拾记忆：AI 驱动的老照片修复变得简单

复兴的艺术：运用AI技术从绘画和雕塑中修复历史肖像

摘要

解锁由AI驱动的图像生成技术，借助Stable Diffusion、JOY Caption Two和FLUX。探索如何从参考图像逆向工程提示，并创造出令人惊叹的新视觉效果。了解更多信息，立即开始创作吧！

章节

workflow:

CustomNodes:

UNETLoader VAELoader VAEDecode...