解锁暗黑风格图像生成:AI 驱动的混合工作流

CN
ComfyUI.org
2025-06-24 09:08:26

解锁暗黑风格图像生成和自动标注!探索如何结合 Florence‑2‑large 与定制模型,打造极致效果的混合工作流。

模型
Lora
显存
中等显存(12–16GB)
阅读时间
3 分钟
查看所需模型

工作流概览

解锁暗黑风格图像生成和自动标注!探索如何结合 Florence‑2‑large 与定制模型,打造极致效果的混合工作流。

内容类型: Workflow

主要用途: Download

所需模型

  • Lora

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:中等显存(12–16GB)。

1. 工作流概述

mcab0lhc6y0xncavh6gyasuoban.png

这是一个黑暗风格图像生成+自动反推提示词的复合工作流,核心功能包括:

  • 通过Florence-2-large模型自动反推输入图像的描述文本(Caption)

  • 使用定制化古风模型@迁士-F.1生成黑暗风格图像

  • 支持文生图(Text-to-Image)和图生图(Image-to-Image)双模式

2. 核心模型

模型名称

功能说明

来源/安装方式

@迁士-F.1-真人大模型

古风黑暗风格生成

需手动下载.safetensors文件

Florence-2-large

图像反推提示词(Caption生成)

通过Florence2ModelLoader自动加载

LoRA: undefined_0003

微调模型风格(权重0.8)

集成在工作流中

3. 关键组件

组件名称

功能说明

安装方式

Florence2Run

执行图像反推生成描述文本

需安装ComfyUI-Florence2插件

SamplerCustomAdvanced

定制化采样器(支持Euler等算法)

内置组件

DualCLIPLoader

加载双CLIP模型(clip_l+t5xxl)

内置组件

4. 工作流分组

  • Group 1: 反推图

    • 输入:上传图像(通过LoadImage

    • 输出:图像描述文本(如:"A black-and-white photograph of...")

  • Group 2: 文生图

    • 输入:触发词(如"dark wind")+ 反推的提示词

    • 输出:1024x1536分辨率黑暗风格图像

5. 输入与输出

  • 输入参数

    • 必填:图像(反推模式)/ 触发词(文生图模式)

    • 可选:种子值(默认随机)、分辨率(1024x1536)

  • 输出结果

    • 生成图像(PNG格式,含元数据)

    • 反推的文本描述(JSON格式)

6. 注意事项

  • 必须安装microsoft/Florence-2-large模型(约5GB)

  • 显存要求:≥12GB(因使用FP8精度模型)

  • 常见错误:若出现LoRA加载失败,检查undefined_0003.safetensors文件路径

常见问题