使用 Capsule Micro LoRA 和 Stable Diffusion 创建令人惊叹的微缩世界

CN
ComfyUI.org
2025-05-07 01:14:58

用 AI 生成令人惊叹的微缩城市景观!学习如何将 Stable Diffusion 与 Capsule Micro World LoRA 相结合,打造震撼的 2 倍超分辨率城市天际线。深入了解背后的工作流程、核心模型与关键节点,掌握这一创新技术。

模型
Lora
Sd
关键节点
Upscaler
显存
低显存(≤8GB)
阅读时间
3 分钟
查看所需模型

工作流概览

用 AI 生成令人惊叹的微缩城市景观!学习如何将 Stable Diffusion 与 Capsule Micro World LoRA 相结合,打造震撼的 2 倍超分辨率城市天际线。深入了解背后的工作流程、核心模型与关键节点,掌握这一创新技术。

内容类型: Workflow

主要用途: Download

所需模型

  • Lora
  • Sd

所需节点

  • Upscaler

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:低显存(≤8GB)。

1. 工作流概述

mad8y6mwcpzqjxgteu8372369197335fe435acb50360792b2577a70087725b741a682aa6d3b8d021a39.png

该工作流专为生成微缩城市景观设计,核心功能是通过Stable Diffusion模型结合胶囊微缩世界LoRA,创造具有宏观与微观视角融合的奇幻场景(如胶囊中的东方明珠塔)。工作流包含文本编码、潜在空间生成、图像放大等完整流程,最终输出高清图像。


2. 核心模型

  • Stable Diffusion (UNETLoader):基础生成模型,使用基础算法_F.1版本,支持FP8精度。

  • 胶囊微缩世界LoRA (胶囊微缩世界丨城市地标_D1.04):微调模型,增强微缩景观细节,权重0.8。

  • T5-XXL & CLIP-L:双文本编码器,提升提示词理解能力。

  • 2xNomosUni超分模型:用于图像后期放大2倍。


3. 关键组件

组件名称

功能

安装方式

依赖项

DualCLIPLoader

加载双文本编码器(T5+CLIP)

内置

需下载t5xxl_fp8_e4m3fn模型

Lora Loader Stack

动态加载多个LoRA模型

需安装rgthree-comfy插件

依赖LoRA文件(如胶囊微缩世界

SamplerCustomAdvanced

高级采样器(支持噪声控制)

内置

ImageUpscaleWithModel

使用超分模型放大图像

内置

2xNomosUni超分模型文件


4. 工作流结构

  • Group 1: 文本输入

    • CLIPTextEncode:输入提示词(如“蓝色胶囊中的上海微缩景观”),输出文本张量。

  • Group 2: 图像生成

    • EmptyLatentImage:设置分辨率(768x1024)。

    • SamplerCustomAdvanced:结合LoRA生成潜在图像。

  • Group 3: 后期处理

    • VAEDecode:将潜在数据解码为图像。

    • ImageUpscaleWithModel:2倍超分辨率放大。


5. 输入与输出

  • 输入参数

    • 必填:提示词、分辨率(768x1024)。

    • 可选:种子值(默认随机)、LoRA权重(默认0.8)。

  • 输出结果:超分后的PNG图像(保存在wangyi AI Studio目录)。


6. 注意事项

  1. 插件依赖:需通过ComfyUI Manager安装rgthree-comfy(LoRA堆叠插件)。

  2. 模型路径:确保LoRA文件(胶囊微缩世界)和超分模型(2xNomosUni)放入对应文件夹。

  3. 性能建议:显存≥8GB,推荐使用fp8_e4m3fn精度降低资源占用。

  4. 常见错误:若提示词无效,检查CLIP模型是否加载成功。


常见问题