探索 AI 艺术生成的魔力:一步步教你掌握完整工作流程

CN
ComfyUI.org
2025-04-14 10:31:24

通过此工作流程自动生成动漫风格图像:利用 AI 从输入图像反推提示词,并结合风格化 LoRA 进行重绘。

模型
Flux
Lora
显存
低显存(≤8GB)
阅读时间
3 分钟
查看所需模型

工作流概览

通过此工作流程自动生成动漫风格图像:利用 AI 从输入图像反推提示词,并结合风格化 LoRA 进行重绘。

内容类型: Workflow

主要用途: Download

所需模型

  • Flux
  • Lora

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:低显存(≤8GB)。

1. 工作流概述

m9gxpjxjf4j17b3zrjg9a842ba5308c2873ca5b95961087a85182714ce12ef1f3d859702c067a43640e.png
  • 作用:基于输入图像快速反推提示词(Tag),并结合LoRA模型进行风格化重绘(如动漫风格)。

  • 核心功能

    • 图像反推:使用Florence-2-base-PromptGen-v2.0模型自动生成描述文本。

    • 风格重绘:通过Flux洗图神器.safetensors LoRA和svdq-int4-flux.1-dev基础模型实现高质量图生图。

    • 自定义控制:支持手动输入触发词(如kk3d ip)与反推结果融合。

2. 关键组件说明

组件名称

功能描述

安装方式

依赖项

Florence2Run

调用Florence-2模型反推图像标签。

需安装ComfyUI-Florence2扩展(GitHub)。

Florence-2-base-PromptGen-v2.0模型(HuggingFace)

NunchakuFluxDiTLoader

加载Flux优化的DiT模型(低显存版)。

需安装ComfyUI-nunchaku扩展。

svdq-int4-flux.1-dev.safetensors

LoraLoaderModelOnly

加载风格化LoRA(如Flux洗图神器)。

需将LoRA文件放入models/loras

依赖基础模型输出

FluxGuidance

增强生成条件控制的强度。

内置组件(需Flux系列模型支持)。

3. 工作流结构(Groups)

  1. 文本反推组

    • 输入:用户上传的原图(如ComfyUI_temp_btare_00003_.png)。

    • 处理:通过Florence2Run生成标签(如1girl, solo, long hair...)。

  2. 提示词融合组

    • 输入:反推标签 + 手动触发词(如kk3d ip)。

    • 输出:合并后的提示词(通过LayerUtility: TextJoin)。

  3. 生成组

    • 模型:svdq-int4-flux.1-dev + Flux洗图神器 LoRA(权重0.8)。

    • 输出:分辨率根据输入图像自适应(默认512x512)。

4. 输入与输出

  • 输入参数

    • 图像:必选(支持PNG/JPG)。

    • 手动触发词:可选(如示例中的kk3d ip)。

    • 降噪强度:默认0.7(通过BasicScheduler控制)。

  • 输出结果

    • 生成图像(保存至ComfyUI输出目录)。

    • 反推的标签文本(显示在ShowText节点中)。

5. 注意事项

  • ⚠️ 兼容性

    • 需安装ComfyUI-nunchakuComfyUI-Florence2扩展。

    • Florence-2模型需手动下载并放置到指定路径。

  • 优化建议

    • 使用svdq-int4模型降低显存占用(适合8GB显存)。

    • 调整FluxGuidance中的强度值(默认3.5)控制生成风格强度。

常见问题