复兴的艺术:运用AI技术从绘画和雕塑中修复历史肖像
借助ControlNet和Stable Diffusion技术,将历史人物转化为逼真的肖像。学习如何利用线条艺术、深度和姿态控制,以达到令人惊叹的效果。
- 关键节点
- Controlnet
- 显存
- 低显存(≤8GB)
- 阅读时间
- 6 分钟
工作流概览
借助ControlNet和Stable Diffusion技术,将历史人物转化为逼真的肖像。学习如何利用线条艺术、深度和姿态控制,以达到令人惊叹的效果。
内容类型: Workflow
主要用途: Download
所需模型
- Controlnet
- Sd
所需节点
- Controlnet
配置说明
- 打开工作流模板前,请先安装所需模型。
- 推荐硬件:低显存(≤8GB)。
📝 工作流概述(Workflow Overview)

本工作流的主要作用是 使用 ControlNet 和 Stable Diffusion 将历史人物的雕像或绘画复原为真实感人像。
它结合 线稿、深度和姿态控制 以确保生成结果与输入图像保持一致,同时通过 文本描述 和 风格选择 来优化生成效果。
🧠 核心模型(Core Models)
1️⃣ Stable Diffusion(UNet)
作用:主要的图像生成模型,基于输入的控制信息和文本描述生成新图像。
使用的模型:
LEOSAM's MoonFilm | 胶片风真实感大模型_2.0安装方式:
通过 ComfyUI Manager 下载并安装。
或者手动下载
.safetensors文件放入models/checkpoints。
2️⃣ ControlNet(控制网络)
作用:用于控制生成图像的结构,使其与输入参考图相匹配。
使用的模型:
control_v11p_sd15_lineart(线稿控制)control_v11f1p_sd15_depth(深度控制)control_v11p_sd15_openpose(姿态控制)
安装方式:
需要下载 ControlNet 插件,并将
.pth文件放入models/controlnet。
3️⃣ VAE(变分自编码器)
作用:提升图像质量,使颜色更加丰富,细节更加清晰。
使用的模型:
vae-ft-mse-840000-ema-pruned.safetensors安装方式:
通过 ComfyUI Manager 下载并安装。
或者手动下载
.vae.pt文件放入models/vae。
4️⃣ CLIP(文本编码器)
作用:将文本描述转换为可用于生成的向量,影响最终的生成效果。
安装方式:
通过 ComfyUI Manager 安装。
或者手动下载
.pt文件放入models/clip。
📦 关键组件(Nodes)
节点 | 作用 |
|---|---|
| 加载 Stable Diffusion 模型 |
| 加载 VAE 变分自编码器 |
| 加载 ControlNet 控制网络 |
| 加载参考图像(古人雕像或绘画) |
| 处理输入图像,提取线稿或深度信息 |
| 处理文本描述,并用于引导图像生成 |
| 结合输入的 ControlNet 数据,应用控制信息 |
| 负责采样和生成图像 |
| 将生成的潜空间转换为最终图像 |
| 保存生成的图像 |
| 预览生成结果 |
📂 主要分组(Workflow Groups)
1️⃣ 线稿控制
作用:通过 ControlNet 线稿模型,确保生成图像的轮廓与输入图像一致。
关键组件:
ControlNetLoader (control_v11p_sd15_lineart)AIO_Preprocessor (AnyLineArtPreprocessor_aux)ControlNetApplyAdvanced
2️⃣ 深度控制
作用:利用深度信息,确保人物的三维形态符合输入图像。
关键组件:
ControlNetLoader (control_v11f1p_sd15_depth)AIO_Preprocessor (DepthAnythingPreprocessor)ControlNetApplyAdvanced
3️⃣ 姿态控制
作用:确保最终生成的姿态与输入人物一致,增强复原效果。
关键组件:
ControlNetLoader (control_v11p_sd15_openpose)DWPreprocessorControlNetApplyAdvanced
🔢 输入 & 输出
📥 主要输入参数
参考图像(用于复原古人的雕像或绘画)
ControlNet 选项(线稿、深度、姿态控制)
采样参数:
种子值(随机性控制)采样方法(DPM++ 2M、Euler 等)采样步数(默认 30 步)
文本描述(用于风格优化)
📤 主要输出
复原后的高质量人像
对比输入图像和生成图像的结果
不同风格(如胶片感)的复原图像
⚠️ 使用注意事项
计算资源需求
需要 至少 8GB GPU(推荐 12GB 以上)。
ControlNet 会占用较多显存,建议减少使用多个 ControlNet 以节省显存。
模型兼容性
建议使用 胶片风格模型(如
LEOSAM's MoonFilm)以提高真实感。ControlNet 的 线稿、深度、姿态 可单独启用,避免干扰。
提示词优化
文本描述可以调整,如:
"1 old man, long hair, black hair, beard, realistic, hanfu"添加
"photography level, cinematic lighting"以提升真实感。
采样参数
采样步数 30~50 步较为合适。
DPM++ 2M采样器通常比 Euler 生成效果更佳。
总结
这个 ComfyUI 工作流结合 ControlNet 的线稿、深度、姿态控制,可以 复原古人的真实感人像,同时支持 风格优化(如胶片风),适用于 历史人物复原、艺术重建 等应用。