探索艺术图像生成的完整工作流程

CN
ComfyUI.org
2025-03-12 08:16:32

使用Flux.1模型和银渐层猫主题生成艺术猫图像。自定义提示并优化质量,以创造令人惊叹的艺术作品。

模型
Flux
Lora
显存
低显存(≤8GB)
阅读时间
8 分钟
查看所需模型

工作流概览

使用Flux.1模型和银渐层猫主题生成艺术猫图像。自定义提示并优化质量,以创造令人惊叹的艺术作品。

内容类型: Workflow

主要用途: Download

所需模型

  • Flux
  • Lora

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:低显存(≤8GB)。

工作流概述

m85ndiv1s9xz4a03tol84094663ebbea4707c44012ed8b3b93b2c93682beea3f811929da21e9b7c3d27.png

此工作流的主要目的是利用 Flux.1 模型从文本提示生成艺术风格图像,特别针对“银渐层”猫(Silver Gradient Cat)的主题。工作流的作用和目的包括:

  • 文本转图像(T2I):基于输入的文本提示生成 512x512 分辨率的图像。

  • 艺术风格优化:通过 Lora 模型(F.1-银渐层 Silver Gradient Cat_v1.0)增强生成图像的银渐层猫主题和艺术效果。

  • 灵活性:允许用户自定义提示词,并通过采样过程优化生成质量。 此工作流适用于艺术创作,尤其是生成特定主题(如猫咪)的艺术图像。

核心模型

  1. Flux.1 (基础算法_F.1)

    • 功能:高效的文本转图像模型,支持生成艺术风格图像。

    • 来源:从 Civitai 或官方仓库下载,文件名为 基础算法_F.1.safetensors,放置在 ComfyUI/models/checkpoints/。

  2. Lora 模型 (F.1-银渐层 Silver Gradient Cat_v1.0)

    • 功能:微调 Flux.1 模型,专注于生成银渐层猫的艺术图像,增强细节和风格。

    • 来源:从 Civitai 下载,放置在 ComfyUI/models/loras/。

  3. VAE 模型 (ae.sft)

    • 功能:解码潜在图像为像素图像,确保生成结果的高质量。

    • 来源:从 Flux.1 相关仓库下载,放置在 ComfyUI/models/vae/。

组件说明

以下是工作流中的关键节点及其用途、功能和安装方法:

  1. UNETLoader

    • 用途:加载 Flux.1 的 UNET 模型。

    • 功能:输出模型对象,驱动生成过程。

    • 安装:ComfyUI 自带。

    • 依赖:需要 基础算法_F.1.safetensors 文件。

  2. DualCLIPLoader

    • 用途:加载 CLIP 模型。

    • 功能:输出 CLIP 对象,用于编码文本提示。

    • 安装:ComfyUI 自带。

    • 依赖:需要 stable-cascade-clip 文件,放置在 ComfyUI/models/clip/。

  3. LoraLoader

    • 用途:加载 Lora 模型。

    • 功能:微调基础模型,生成银渐层猫风格。

    • 安装:ComfyUI 自带。

    • 依赖:需要 F.1-银渐层 Silver Gradient Cat_v1.0 文件。

  4. CLIPTextEncodeFlux

    • 用途:编码正向文本提示。

    • 功能:将用户输入的提示词转换为条件数据,指导比例为 3.5。

    • 安装:ComfyUI 自带。

  5. CLIPTextEncode

    • 用途:编码负向文本提示。

    • 功能:排除不良生成结果(如“Worst quality”)。

    • 安装:ComfyUI 自带。

  6. EmptyLatentImage

    • 用途:创建初始潜在图像。

    • 功能:生成 512x512 的潜在空间,批次为 9。

    • 安装:ComfyUI 自带。

  7. KSampler

    • 用途:执行采样生成。

    • 功能:结合模型和条件生成潜在图像,采样步数为 20,采样器为 Euler。

    • 安装:ComfyUI 自带。

  8. VAELoader

    • 用途:加载 VAE 模型。

    • 功能:输出 VAE 对象,用于解码。

    • 安装:ComfyUI 自带。

    • 依赖:需要 ae.sft 文件。

  9. VAEDecode

    • 用途:解码潜在图像。

    • 功能:将潜在图像转换为像素图像。

    • 安装:ComfyUI 自带。

  10. SaveImage

    • 用途:保存生成图像。

    • 功能:将生成结果保存为 ComfyUI 命名的文件。

    • 安装:ComfyUI 自带。

工作流结构

  1. 模型加载组

    • 作用:加载 Flux.1 基础模型和 Lora 模型。

    • 输入参数:模型文件路径(基础算法_F.1 和 F.1-银渐层 Silver Gradient Cat_v1.0)。

    • 输出结果:微调后的模型和 CLIP 对象。

  2. 文本编码组

    • 作用:编码正向和负向提示词。

    • 输入参数:正向提示词(用户自定义)、负向提示词(空或“Worst quality”)、指导比例(3.5)。

    • 输出结果:编码后的条件数据。

  3. 生成组

    • 作用:生成艺术图像。

    • 输入参数:微调模型、条件数据、潜在图像(512x512)、采样参数(20 步、Euler)。

    • 输出结果:潜在图像。

  4. 解码与保存组

    • 作用:解码并保存图像。

    • 输入参数:潜在图像、VAE 模型。

    • 输出结果:512x512 像素图像,保存为 PNG 文件。

输入与输出

  • 预期输入参数

    • 分辨率:512x512。

    • 批次大小:9。

    • 种子值:随机(或指定)。

    • 正向提示词:用户自定义(当前为空,需填写,如“a silver gradient cat in a cozy room”)。

    • 负向提示词:空(建议添加“Worst quality, blurry”)。

    • 采样步数:20。

    • 指导比例:3.5。

  • 最终输出

    • 艺术风格图像(PNG 格式,512x512 分辨率,主题为银渐层猫)。

注意事项

  1. 资源需求:Flux.1 生成需 8GB+ VRAM,建议使用 GPU。

  2. 模型文件:确保 基础算法_F.1.safetensors 和 ae.sft 存在于正确路径。

  3. 提示词优化:当前正向提示词为空,建议输入具体描述(如猫的外观、背景)以提高生成质量。

  4. 性能优化:减少采样步数(20→10)或批次大小(9→1)以加快生成。

  5. 兼容性:ComfyUI 版本需 0.3.18 或更高。

示例说明

  • 输入:提示词“a silver gradient cat with shimmering fur, sitting in a cozy room with warm lighting”。

  • 过程

    1. 加载 Flux.1 模型和 Lora。

    2. 编码提示词为条件。

    3. 生成 512x512 潜在图像。

    4. 解码为像素图像。

    5. 保存为 ComfyUI.png。

  • 输出:一幅描绘银渐层猫的艺术图像,毛发闪烁,背景温暖。

常见问题