探索 AI 艺术生成的魔力:一步步教你掌握完整工作流程
通过此工作流程自动生成动漫风格图像:利用 AI 从输入图像反推提示词,并结合风格化 LoRA 进行重绘。
- 显存
- 低显存(≤8GB)
- 阅读时间
- 3 分钟
工作流概览
通过此工作流程自动生成动漫风格图像:利用 AI 从输入图像反推提示词,并结合风格化 LoRA 进行重绘。
内容类型: Workflow
主要用途: Download
所需模型
- Flux
- Lora
配置说明
- 打开工作流模板前,请先安装所需模型。
- 推荐硬件:低显存(≤8GB)。
1. 工作流概述

作用:基于输入图像快速反推提示词(Tag),并结合LoRA模型进行风格化重绘(如动漫风格)。
核心功能:
图像反推:使用
Florence-2-base-PromptGen-v2.0模型自动生成描述文本。风格重绘:通过
Flux洗图神器.safetensorsLoRA和svdq-int4-flux.1-dev基础模型实现高质量图生图。自定义控制:支持手动输入触发词(如
kk3d ip)与反推结果融合。
2. 关键组件说明
组件名称 | 功能描述 | 安装方式 | 依赖项 |
|---|---|---|---|
| 调用Florence-2模型反推图像标签。 | 需安装 |
|
| 加载Flux优化的DiT模型(低显存版)。 | 需安装 |
|
| 加载风格化LoRA(如 | 需将LoRA文件放入 | 依赖基础模型输出 |
| 增强生成条件控制的强度。 | 内置组件(需Flux系列模型支持)。 | 无 |
3. 工作流结构(Groups)
文本反推组
输入:用户上传的原图(如
ComfyUI_temp_btare_00003_.png)。处理:通过
Florence2Run生成标签(如1girl, solo, long hair...)。
提示词融合组
输入:反推标签 + 手动触发词(如
kk3d ip)。输出:合并后的提示词(通过
LayerUtility: TextJoin)。
生成组
模型:
svdq-int4-flux.1-dev+Flux洗图神器LoRA(权重0.8)。输出:分辨率根据输入图像自适应(默认512x512)。
4. 输入与输出
输入参数:
图像:必选(支持PNG/JPG)。
手动触发词:可选(如示例中的
kk3d ip)。降噪强度:默认0.7(通过
BasicScheduler控制)。
输出结果:
生成图像(保存至
ComfyUI输出目录)。反推的标签文本(显示在
ShowText节点中)。
5. 注意事项
⚠️ 兼容性:
需安装
ComfyUI-nunchaku和ComfyUI-Florence2扩展。Florence-2模型需手动下载并放置到指定路径。
✅ 优化建议:
使用
svdq-int4模型降低显存占用(适合8GB显存)。调整
FluxGuidance中的强度值(默认3.5)控制生成风格强度。