探索国潮艺术创作工作流程

CN
ComfyUI.org
2025-03-17 10:51:00

解锁令人惊叹的国潮风格插图,尽在我们先进的Stable Diffusion流程!探索如何通过我们的工作流程生成、增强和精修高质量图像。了解更多,提升您的艺术创作!

关键节点
Controlnet
Upscaler
显存
中等显存(12–16GB)
阅读时间
6 分钟
查看所需模型

工作流概览

解锁令人惊叹的国潮风格插图,尽在我们先进的Stable Diffusion流程!探索如何通过我们的工作流程生成、增强和精修高质量图像。了解更多,提升您的艺术创作!

内容类型: Workflow

主要用途: Download

所需模型

  • Controlnet
  • Lora
  • Sd

所需节点

  • Controlnet
  • Upscaler

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:中等显存(12–16GB)。

工作流概述

m8cy5s3o58h8dz0d4yu1838194341cc07e28f8cc70cb354798c43df47719ee60db01a3a3f90a952a8d7 (1).jpg

这个工作流是一个基于 Stable Diffusion 的复杂图像生成和优化流程,旨在生成高质量的国潮风格插画图像。其主要功能包括:

  1. 使用 Stable Diffusion 生成初始图像。

  2. 通过图像混合(ImageBlend)和深度图增强(DepthAnything V2)优化图像细节。

  3. 结合 ControlNet(深度控制)和多次采样(KSampler)提升图像质量。

  4. 最终通过超分辨率模型(RealESRGAN 和 UltimateSDUpscale)将图像放大到更高分辨率。

核心模型

  • Stable Diffusion:核心生成模型,使用“锦绣芳华——国潮插画风_v1.0.safetensors”生成国潮风格图像。

  • LoRA(国潮-插画艺术_v1.0.safetensors):增强模型的国潮插画风格特征。

  • CLIP:从“CheckpointLoaderSimple”加载,用于处理文本提示。

  • VAE(vae-ft-mse-840000-ema-pruned.ckpt):编码和解码图像,优化生成过程。

  • ControlNet(control_v11f1p_sd15_depth.pth):基于深度图控制生成细节。

  • DepthAnything V2(depth_anything_v2_vitl_fp32.safetensors):生成深度图,用于增强图像立体感。

  • RealESRGAN(RealESRGAN_x2.pth 和 RealESRGAN_x4plus_anime_6B.pth):超分辨率模型,用于放大图像。

组件说明

  1. CheckpointLoaderSimple:加载 Stable Diffusion 模型、CLIP 和 VAE。

    • 安装:ComfyUI 默认节点。

  2. KSamplerAdvanced:高级采样器,用于生成或优化潜空间图像。

    • 安装:ComfyUI 默认节点。

  3. EmptyLatentImage:创建空白潜空间图像。

    • 安装:ComfyUI 默认节点。

  4. CLIP Positive-Negative (WLSH):处理正向和负向提示词。

    • 安装:需通过 ComfyUI Manager 安装 WLSH 自定义节点。

  5. VAEDecode:将潜空间图像解码为可见图像。

    • 安装:ComfyUI 默认节点。

  6. ImageBlend:混合两张图像。

    • 安装:ComfyUI 默认节点。

  7. DepthAnything_V2:生成深度图。

    • 安装:需通过 ComfyUI Manager 安装 DepthAnything V2 插件,模型从 Hugging Face 下载。

  8. ControlNetLoader 和 ControlNetApply:加载和应用 ControlNet。

    • 安装:ComfyUI 默认节点,模型从 Civitai 或 Hugging Face 获取。

  9. UpscaleModelLoader 和 ImageUpscaleWithModel:加载和应用超分辨率模型。

    • 安装:ComfyUI 默认节点,模型从 GitHub 或 RealESRGAN 官方获取。

  10. HD UltimateSDUpscale:高级超分辨率增强。

    • 安装:需通过 ComfyUI Manager 安装 UltimateSDUpscale 插件。

  11. AV_VAELoader:加载外部 VAE 模型。

    • 安装:需通过 ComfyUI Manager 安装 AnimateVision (AV) 插件。

工作流结构

  1. 初始图像生成组

    • 节点:EmptyLatentImage → KSamplerAdvanced → VAEDecode

    • 作用:生成两张初始图像(512x288 和 512x1024)。

    • 输入:提示词(如“Guochao(style), distant mountains”)、种子值、采样步数。

    • 输出:两张初始图像。

  2. 图像混合与深度增强组

    • 节点:ImageBlend → DepthAnything_V2 → VAEEncode

    • 作用:混合两张初始图像并生成深度图,再编码回潜空间。

    • 输入:两张初始图像、混合比例(0.38)。

    • 输出:混合图像的潜空间表示和深度图。

  3. ControlNet 优化组

    • 节点:ControlNetLoader → ControlNetApply → KSamplerAdvanced

    • 作用:使用深度图通过 ControlNet 优化图像。

    • 输入:深度图、提示词、ControlNet 强度(0.7)。

    • 输出:优化后的潜空间图像。

  4. 超分辨率放大组

    • 节点:UpscaleModelLoader → ImageUpscaleWithModel → HD UltimateSDUpscale

    • 作用:逐步放大图像至更高分辨率。

    • 输入:优化后的图像、超分辨率模型。

    • 输出:最终高分辨率图像。

输入与输出

  • 输入

    • 正向提示词:如“Main building, clouds, sky, mountains, guochaochahua”。

    • 负向提示词:如“mankind, monochrome”。

    • 分辨率:初始 512x288 和 512x1024,最终放大至更高分辨率。

    • 种子值:随机或指定。

  • 输出:一张高质量的国潮风格插画图像(放大后格式为 PNG)。

注意事项

  • 错误:确保模型路径正确,否则会报“模型未找到”错误。

  • 性能优化:建议使用 FP16 精度以减少内存占用。

  • 兼容性:WLSH 和 UltimateSDUpscale 需最新版 ComfyUI 支持。

  • 资源需求:推荐至少 12GB GPU 内存,CPU 运行可能较慢。

常见问题