“绽放的建筑:人工智能生成的惊艳图像”
解锁人工智能驱动的图像生成!探索一个结合建筑与花卉的工作流程,使用 Stable Diffusion、ControlNet 等工具,打造惊艳的高分辨率视觉效果。学习如何通过盛开的花朵和焕新效果让您的图像栩栩如生!
- 关键节点
- Controlnet
- 显存
- 低显存(≤8GB)
- 难度
- 中级
- 阅读时间
- 5 分钟
工作流概览
解锁人工智能驱动的图像生成!探索一个结合建筑与花卉的工作流程,使用 Stable Diffusion、ControlNet 等工具,打造惊艳的高分辨率视觉效果。学习如何通过盛开的花朵和焕新效果让您的图像栩栩如生!
内容类型: Workflow
主要用途: Download
所需模型
- Controlnet
- Lora
- Sd
所需节点
- Controlnet
配置说明
- 打开工作流模板前,请先安装所需模型。
- 推荐硬件:低显存(≤8GB)。
- 预期技能水平:中级。
- 使用上方下载按钮将工作流 JSON 导入 ComfyUI。
工作流概述

这个工作流的主要目的是生成一幅建筑与花朵结合的图像,通过 AI 模型对建筑图像进行处理,添加花朵元素,营造出一种万物复苏、花开满建筑的视觉效果。工作流结合了多种 AI 模型和图像处理技术,能够生成高质量、高分辨率的图像。
核心模型
Stable Diffusion:用于生成高质量的图像,基于文本提示和图像输入生成新的图像。
ControlNet:用于控制生成图像的结构和风格,确保建筑结构在添加花朵元素后仍然保持清晰。
DepthAnything_V2:用于深度估计,帮助模型理解图像的深度信息,从而更好地生成花朵覆盖的效果。
LoraLoaderModelOnly:加载 Lora 模型,用于增强图像的特定风格(如花开效果)。
VAE(变分自编码器):用于图像的编码和解码,帮助生成高质量的图像。
组件说明
DualCLIPLoader:加载 CLIP 模型,用于文本和图像的嵌入。
VAELoader:加载 VAE 模型,用于图像的编码和解码。
InstructPixToPixConditioning:基于图像和文本提示生成条件信息,控制图像生成的过程。
CLIPTextEncode:将文本提示编码为模型可以理解的向量。
KSampler:采样器,控制图像生成的过程,包括步数、CFG 值等。
DepthAnything_V2:深度估计模型,帮助生成图像的深度信息。
LoraLoaderModelOnly:加载 Lora 模型,增强图像的特定风格。
VAEDecode:将生成的潜变量解码为最终的图像。
SaveImage:保存生成的图像。
组件安装
ComfyUI Manager:通过 ComfyUI Manager 可以方便地安装和管理各种节点和插件。
GitHub 手动安装:对于一些特殊的节点或插件,可能需要从 GitHub 手动下载并安装。
工作流结构
模型加载组:负责加载 Stable Diffusion 模型、VAE 模型和 CLIP 模型。
文本编码组:将用户输入的文本提示编码为向量。
图像生成组:使用 KSampler 生成图像,并通过 VAE Decode 解码为最终图像。
图像保存组:将生成的图像保存到指定路径。
输入与输出
输入:文本提示、分辨率、种子值、CFG 值、步数等。
输出:生成的图像,通常以 PNG 或 JPG 格式保存。
注意事项
性能优化:建议使用高性能 GPU 以加快图像生成速度。
兼容性问题:确保所有节点和插件版本兼容,避免出现错误。
资源需求:图像生成对显存要求较高,建议显存至少为 8GB。