探索国潮艺术创作工作流程
解锁令人惊叹的国潮风格插图,尽在我们先进的Stable Diffusion流程!探索如何通过我们的工作流程生成、增强和精修高质量图像。了解更多,提升您的艺术创作!
- 显存
- 中等显存(12–16GB)
- 阅读时间
- 6 分钟
工作流概览
解锁令人惊叹的国潮风格插图,尽在我们先进的Stable Diffusion流程!探索如何通过我们的工作流程生成、增强和精修高质量图像。了解更多,提升您的艺术创作!
内容类型: Workflow
主要用途: Download
所需模型
- Controlnet
- Lora
- Sd
所需节点
- Controlnet
- Upscaler
配置说明
- 打开工作流模板前,请先安装所需模型。
- 推荐硬件:中等显存(12–16GB)。
工作流概述
.jpg)
这个工作流是一个基于 Stable Diffusion 的复杂图像生成和优化流程,旨在生成高质量的国潮风格插画图像。其主要功能包括:
使用 Stable Diffusion 生成初始图像。
通过图像混合(ImageBlend)和深度图增强(DepthAnything V2)优化图像细节。
结合 ControlNet(深度控制)和多次采样(KSampler)提升图像质量。
最终通过超分辨率模型(RealESRGAN 和 UltimateSDUpscale)将图像放大到更高分辨率。
核心模型
Stable Diffusion:核心生成模型,使用“锦绣芳华——国潮插画风_v1.0.safetensors”生成国潮风格图像。
LoRA(国潮-插画艺术_v1.0.safetensors):增强模型的国潮插画风格特征。
CLIP:从“CheckpointLoaderSimple”加载,用于处理文本提示。
VAE(vae-ft-mse-840000-ema-pruned.ckpt):编码和解码图像,优化生成过程。
ControlNet(control_v11f1p_sd15_depth.pth):基于深度图控制生成细节。
DepthAnything V2(depth_anything_v2_vitl_fp32.safetensors):生成深度图,用于增强图像立体感。
RealESRGAN(RealESRGAN_x2.pth 和 RealESRGAN_x4plus_anime_6B.pth):超分辨率模型,用于放大图像。
组件说明
CheckpointLoaderSimple:加载 Stable Diffusion 模型、CLIP 和 VAE。
安装:ComfyUI 默认节点。
KSamplerAdvanced:高级采样器,用于生成或优化潜空间图像。
安装:ComfyUI 默认节点。
EmptyLatentImage:创建空白潜空间图像。
安装:ComfyUI 默认节点。
CLIP Positive-Negative (WLSH):处理正向和负向提示词。
安装:需通过 ComfyUI Manager 安装 WLSH 自定义节点。
VAEDecode:将潜空间图像解码为可见图像。
安装:ComfyUI 默认节点。
ImageBlend:混合两张图像。
安装:ComfyUI 默认节点。
DepthAnything_V2:生成深度图。
安装:需通过 ComfyUI Manager 安装 DepthAnything V2 插件,模型从 Hugging Face 下载。
ControlNetLoader 和 ControlNetApply:加载和应用 ControlNet。
安装:ComfyUI 默认节点,模型从 Civitai 或 Hugging Face 获取。
UpscaleModelLoader 和 ImageUpscaleWithModel:加载和应用超分辨率模型。
安装:ComfyUI 默认节点,模型从 GitHub 或 RealESRGAN 官方获取。
HD UltimateSDUpscale:高级超分辨率增强。
安装:需通过 ComfyUI Manager 安装 UltimateSDUpscale 插件。
AV_VAELoader:加载外部 VAE 模型。
安装:需通过 ComfyUI Manager 安装 AnimateVision (AV) 插件。
工作流结构
初始图像生成组
节点:EmptyLatentImage → KSamplerAdvanced → VAEDecode
作用:生成两张初始图像(512x288 和 512x1024)。
输入:提示词(如“Guochao(style), distant mountains”)、种子值、采样步数。
输出:两张初始图像。
图像混合与深度增强组
节点:ImageBlend → DepthAnything_V2 → VAEEncode
作用:混合两张初始图像并生成深度图,再编码回潜空间。
输入:两张初始图像、混合比例(0.38)。
输出:混合图像的潜空间表示和深度图。
ControlNet 优化组
节点:ControlNetLoader → ControlNetApply → KSamplerAdvanced
作用:使用深度图通过 ControlNet 优化图像。
输入:深度图、提示词、ControlNet 强度(0.7)。
输出:优化后的潜空间图像。
超分辨率放大组
节点:UpscaleModelLoader → ImageUpscaleWithModel → HD UltimateSDUpscale
作用:逐步放大图像至更高分辨率。
输入:优化后的图像、超分辨率模型。
输出:最终高分辨率图像。
输入与输出
输入:
正向提示词:如“Main building, clouds, sky, mountains, guochaochahua”。
负向提示词:如“mankind, monochrome”。
分辨率:初始 512x288 和 512x1024,最终放大至更高分辨率。
种子值:随机或指定。
输出:一张高质量的国潮风格插画图像(放大后格式为 PNG)。
注意事项
错误:确保模型路径正确,否则会报“模型未找到”错误。
性能优化:建议使用 FP16 精度以减少内存占用。
兼容性:WLSH 和 UltimateSDUpscale 需最新版 ComfyUI 支持。
资源需求:推荐至少 12GB GPU 内存,CPU 运行可能较慢。