探索艺术图像生成的完整工作流程
使用Flux.1模型和银渐层猫主题生成艺术猫图像。自定义提示并优化质量,以创造令人惊叹的艺术作品。
- 显存
- 低显存(≤8GB)
- 阅读时间
- 8 分钟
工作流概览
使用Flux.1模型和银渐层猫主题生成艺术猫图像。自定义提示并优化质量,以创造令人惊叹的艺术作品。
内容类型: Workflow
主要用途: Download
所需模型
- Flux
- Lora
配置说明
- 打开工作流模板前,请先安装所需模型。
- 推荐硬件:低显存(≤8GB)。
工作流概述

此工作流的主要目的是利用 Flux.1 模型从文本提示生成艺术风格图像,特别针对“银渐层”猫(Silver Gradient Cat)的主题。工作流的作用和目的包括:
文本转图像(T2I):基于输入的文本提示生成 512x512 分辨率的图像。
艺术风格优化:通过 Lora 模型(F.1-银渐层 Silver Gradient Cat_v1.0)增强生成图像的银渐层猫主题和艺术效果。
灵活性:允许用户自定义提示词,并通过采样过程优化生成质量。 此工作流适用于艺术创作,尤其是生成特定主题(如猫咪)的艺术图像。
核心模型
Flux.1 (基础算法_F.1)
功能:高效的文本转图像模型,支持生成艺术风格图像。
来源:从 Civitai 或官方仓库下载,文件名为 基础算法_F.1.safetensors,放置在 ComfyUI/models/checkpoints/。
Lora 模型 (F.1-银渐层 Silver Gradient Cat_v1.0)
功能:微调 Flux.1 模型,专注于生成银渐层猫的艺术图像,增强细节和风格。
来源:从 Civitai 下载,放置在 ComfyUI/models/loras/。
VAE 模型 (ae.sft)
功能:解码潜在图像为像素图像,确保生成结果的高质量。
来源:从 Flux.1 相关仓库下载,放置在 ComfyUI/models/vae/。
组件说明
以下是工作流中的关键节点及其用途、功能和安装方法:
UNETLoader
用途:加载 Flux.1 的 UNET 模型。
功能:输出模型对象,驱动生成过程。
安装:ComfyUI 自带。
依赖:需要 基础算法_F.1.safetensors 文件。
DualCLIPLoader
用途:加载 CLIP 模型。
功能:输出 CLIP 对象,用于编码文本提示。
安装:ComfyUI 自带。
依赖:需要 stable-cascade-clip 文件,放置在 ComfyUI/models/clip/。
LoraLoader
用途:加载 Lora 模型。
功能:微调基础模型,生成银渐层猫风格。
安装:ComfyUI 自带。
依赖:需要 F.1-银渐层 Silver Gradient Cat_v1.0 文件。
CLIPTextEncodeFlux
用途:编码正向文本提示。
功能:将用户输入的提示词转换为条件数据,指导比例为 3.5。
安装:ComfyUI 自带。
CLIPTextEncode
用途:编码负向文本提示。
功能:排除不良生成结果(如“Worst quality”)。
安装:ComfyUI 自带。
EmptyLatentImage
用途:创建初始潜在图像。
功能:生成 512x512 的潜在空间,批次为 9。
安装:ComfyUI 自带。
KSampler
用途:执行采样生成。
功能:结合模型和条件生成潜在图像,采样步数为 20,采样器为 Euler。
安装:ComfyUI 自带。
VAELoader
用途:加载 VAE 模型。
功能:输出 VAE 对象,用于解码。
安装:ComfyUI 自带。
依赖:需要 ae.sft 文件。
VAEDecode
用途:解码潜在图像。
功能:将潜在图像转换为像素图像。
安装:ComfyUI 自带。
SaveImage
用途:保存生成图像。
功能:将生成结果保存为 ComfyUI 命名的文件。
安装:ComfyUI 自带。
工作流结构
模型加载组
作用:加载 Flux.1 基础模型和 Lora 模型。
输入参数:模型文件路径(基础算法_F.1 和 F.1-银渐层 Silver Gradient Cat_v1.0)。
输出结果:微调后的模型和 CLIP 对象。
文本编码组
作用:编码正向和负向提示词。
输入参数:正向提示词(用户自定义)、负向提示词(空或“Worst quality”)、指导比例(3.5)。
输出结果:编码后的条件数据。
生成组
作用:生成艺术图像。
输入参数:微调模型、条件数据、潜在图像(512x512)、采样参数(20 步、Euler)。
输出结果:潜在图像。
解码与保存组
作用:解码并保存图像。
输入参数:潜在图像、VAE 模型。
输出结果:512x512 像素图像,保存为 PNG 文件。
输入与输出
预期输入参数:
分辨率:512x512。
批次大小:9。
种子值:随机(或指定)。
正向提示词:用户自定义(当前为空,需填写,如“a silver gradient cat in a cozy room”)。
负向提示词:空(建议添加“Worst quality, blurry”)。
采样步数:20。
指导比例:3.5。
最终输出:
艺术风格图像(PNG 格式,512x512 分辨率,主题为银渐层猫)。
注意事项
资源需求:Flux.1 生成需 8GB+ VRAM,建议使用 GPU。
模型文件:确保 基础算法_F.1.safetensors 和 ae.sft 存在于正确路径。
提示词优化:当前正向提示词为空,建议输入具体描述(如猫的外观、背景)以提高生成质量。
性能优化:减少采样步数(20→10)或批次大小(9→1)以加快生成。
兼容性:ComfyUI 版本需 0.3.18 或更高。
示例说明
输入:提示词“a silver gradient cat with shimmering fur, sitting in a cozy room with warm lighting”。
过程:
加载 Flux.1 模型和 Lora。
编码提示词为条件。
生成 512x512 潜在图像。
解码为像素图像。
保存为 ComfyUI.png。
输出:一幅描绘银渐层猫的艺术图像,毛发闪烁,背景温暖。