解锁逼真的人像照片:利用 AI 技术将卡通图片转化为真实照片
通过 AI 将卡通图片转化为逼真的人像照片|学习如何利用 ControlNet、LoRA 模型和 FLUX 技术优化手部和面部细节。
- 显存
- 低显存(≤8GB)
- 阅读时间
- 6 分钟
工作流概览
通过 AI 将卡通图片转化为逼真的人像照片|学习如何利用 ControlNet、LoRA 模型和 FLUX 技术优化手部和面部细节。
内容类型: Workflow
主要用途: Download
所需模型
- Flux
- Controlnet
- Lora
所需节点
- Controlnet
- Upscaler
配置说明
- 打开工作流模板前,请先安装所需模型。
- 推荐硬件:低显存(≤8GB)。
工作流概述

这个工作流的主要目的是将卡通图片转换为真人风格,同时对手部和面部进行精细化处理。通过使用 ControlNet、LoRA 模型和 FLUX 技术,工作流能够将卡通图像转换为逼真的真人图像,并确保手部和面部的细节得到优化。工作流还支持高清放大功能,进一步提升图像的清晰度和细节。
核心模型
工作流中使用了以下核心模型:
ControlNet:用于控制生成图像的结构和内容,支持多种预处理器(如 Depth、OpenPose 等)。
LoRA 模型:
F.1小红书极致真实清纯网红_1.0和极氪白白酱F.1-人像V8MAX_V8MAX,用于微调生成图像的风格和细节。FLUX 模型:
flux1-redux-dev,用于风格迁移和图像生成。VAE 模型:
ae.sft,用于图像的编码和解码。
组件说明
工作流中的关键组件(Nodes)包括:
LoadImage:加载输入的卡通图像。
ControlNetLoader:加载 ControlNet 模型,支持多种预处理器。
StyleModelLoader:加载 FLUX 风格模型,用于风格迁移。
LoraLoaderModelOnly:加载 LoRA 模型,用于微调生成图像的风格。
CLIPTextEncode:将提示词编码为模型可以理解的条件向量。
KSampler:采样器,用于生成图像的过程,控制生成图像的步骤和细节。
VAEDecode:将潜在空间图像解码为可视图像。
PreviewImage:预览生成的图像。
UltimateSDUpscale:高清放大组件,提升图像的清晰度和细节。
安装方法:
ControlNet、LoRA、FLUX 等组件需要通过 ComfyUI Manager 或 GitHub 安装相应的插件。例如:
ControlNet 插件:
ComfyUI_ControlNetLoRA 插件:
ComfyUI_Comfyroll_CustomNodesFLUX 插件:
ComfyUI_IPAdapter_plus
依赖的特殊模型:
ControlNet 模型(如
FLUX.1-dev-ControlNet-Union-Pro-InstantX.safetensors)需要从 Hugging Face 或其他模型仓库下载。LoRA 模型(如
F.1小红书极致真实清纯网红_1.0)也需要从相应的仓库下载。
工作流结构
工作流可以分为以下几个主要部分:
图像加载组:
LoadImage:加载输入的卡通图像。
输入:图像文件路径(如
267ffa96a39eeb73153bd3f6af7956af5dce314c1387f854a8210a5cedfc78da.png)。输出:加载的图像数据,供后续节点使用。
ControlNet 控制组:
多个 ControlNetLoader 和 ControlNetApplyAdvanced 节点,分别加载和应用不同的 ControlNet 模型(如 Depth、OpenPose 等)。
输入:从 LoadImage 节点传递的图像数据。
输出:经过 ControlNet 处理的条件图像。
风格迁移组:
StyleModelLoader 和 StyleModelApply 节点,加载和应用 FLUX 风格模型,实现风格迁移。
输入:参考图像和生成模型。
输出:具有参考图像风格的生成图像。
图像生成组:
KSampler 和 VAEDecode 节点,生成并解码图像。
输入:经过 ControlNet 和 FLUX 处理的条件图像。
输出:最终生成的图像。
高清放大组:
UltimateSDUpscale 节点,对生成的图像进行高清放大处理。
输入:生成的图像数据。
输出:高清放大后的图像。
输入与输出
输入:
卡通图像文件路径(如
267ffa96a39eeb73153bd3f6af7956af5dce314c1387f854a8210a5cedfc78da.png)。提示词(如
Realism, photos, real people,Skin texture, super clear)。
输出:
生成的真人风格图像,保存为 PNG 或 JPG 格式。
注意事项
模型下载:确保所有使用的模型(如 ControlNet、LoRA、FLUX 等)已正确下载并放置在 ComfyUI 的模型目录中。
性能需求:生成高分辨率图像可能需要较高的 GPU 显存,建议使用至少 8GB 显存的 GPU。
提示词优化:提示词的质量直接影响生成图像的效果,建议使用详细的描述词。
兼容性:确保使用的 ComfyUI 版本与工作流中的组件兼容。