comfy.hebolide.com

workflow

探索惊艳图像创作流程：基于Flux.1的文本到图像生成

SUPIR-8K壁纸级放大逐步指南

让您的照片动起来：利用Sonic Diffusion和NTCosyVoice实现AI驱动的视频生成

探索水彩风格图片创作过程

探索艺术图像生成的完整工作流程

揭秘敖闰：革命性的中国神话艺术创作流程

探索终极东方艺术创作流程与AI的结合

“释放艺术潜力：深入探索 Flux.1 和 Florence-2 工作流程”

探索宫崎骏风格电影分镜图像创作流程

探索多高质量图片的创作流程

一键抠图：ComfyUI的CLIP与AWPainting模型图像生成指南

探索水彩插画创作工作流程

探索图片无缝换脸创作流程

突破画框：FLUX 模型图像扩展的逐步工作流程

掌握背景替换的艺术：逐步AI工作流程

打造惊艳角色艺术：北欧精灵肖像的逐步指南

重拾记忆：AI 驱动的老照片修复变得简单

利用Stable Diffusion、JOY Caption Two和LORA提升您的图像生成技艺

复兴的艺术：运用AI技术从绘画和雕塑中修复历史肖像

解锁惊艳视觉效果：Stable Diffusion工作流程的逐步指南

探索国潮艺术创作工作流程

轻松创建惊艳动画视频：Flux.1与WanVideo教程

解锁专业级海报设计：运用Miluo高级美学工作流程

探索Flux室内设计工作流程

从真实到动漫：深入解析高级图像变换工作流程

从文本到视频：WanVideo 与 ControlNet 如何改变游戏规则

解锁惊艳建筑视觉效果：探索Stable Diffusion XL工作流程

解锁视频换脸：掌握ReActor与RIFE，成就专业视频编辑

解锁图像风格迁移：深入探讨 ControlNet 和 IPAdapter 工作流

轻松去除背景：ComfyUI工作流的逐步指南

探索 AI 自动转换线条图的工作流程

🚀 使用 AI 将您的照片转化为惊艳的二次元杰作！

解锁逼真的人像照片：利用 AI 技术将卡通图片转化为真实照片

解锁梦幻云朵场景：工作流逐步部署指南

利用ComfyUI的尖端工作流程提升纹理与皮肤真实感

探索生成参考图同类图片工作流程

肖像编辑的未来：驾驭ControlNet与LoRA模型

探索中国古风手绘艺术创作流程

解锁电影级人像：使用高级 ComfyUI 工作流打造背光杰作！

焕新你的视频：AI 驱动的帧级修复与增强

释放视频转动画的力量：全面流程指南

用AI焕新您的产品图片：全流程指南

探索精准图像生成工作流程

解锁春季活力：将文字转化为惊艳的3D艺术作品

掌握深度控制与风格迁移，尽在这款前沿流程

实现无与伦比的图像质量：减少AI伪影的专家级工作流

通过FLUX和差分扩散解锁无缝图像修复

使用AI驱动的FLUX解锁中国水墨画的奥秘

从照片到杰作：利用AI将单张照片转化为多场景作品

探索照片转素描的工作流程

解锁动漫艺术大师级创作：自动上色工作流揭秘

解锁动漫风格视频魔法：WAN2.1逐步工作流指南

解锁高效角色图像创作：全面工作流指南

探索超真实皮肤质感图片创作流程

掌握图像修饰：电商领域的全面工作流

解锁惊艳人像：高级AI工作流揭秘

使用AI驱动的工作流解锁可自定义的卡通表情包

解锁完美手部修复：AI驱动工作流揭秘

使用高级AI流水线解锁专业级角色与场景融合

通过IPAdapterFaceIDKolors与ControlNet解锁真实材质迁移

从概念到现实：掌握渐进式去噪与超分辨率技术

解锁线稿转化为3D风格渲染工作流程

从图像到视频：深入解析Wan2.1-I2V工作流

解锁文本生成视频的强大能力：阿里巴巴Wanx-8G模型解析

极简杰作：AI驱动的渐变风格艺术工作流

解锁3D魔法：将2D线稿转换为3D的逐步工作流程

解锁文本生成视频的强大能力，体验阿里云Wan2.1模型

探索对口型同步的卡通头像视频工作流程

通过基于 Wan 模型的工作流程解锁高级视频深度控制

终极视频生成管道：功能、模型与优化

使用先进的AI模型，将您的视频转换为动漫风格的杰作

使用 DeepSeek-R1 32B LLM 解锁专业级 AI 艺术提示词！

解锁无瑕图像：AI驱动的水印去除工作流

改造您的产品图片：高级风格迁移与合成技术

解锁专业证件照制作工作流程

解锁惊艳的60帧视频：全面工作流程指南

解锁惊艳的视频生成与风格控制：全面工作流程指南

探索使用 PulID Flux 生成 3D 虚拟头像的工作流程

提升视觉表达力：面向专业人士的 Wan2.1 视频生成工作流

掌握视频创作：首帧/末帧生成与增强工作流

探索生成烹饪猫咪视频的工作流程

利用AI技术将您的视频转化为风格化动画

通过AI驱动的视频生成，解锁360度产品动画

从原始到精细：通过先进模型掌握图像处理技巧

借助 Flux Diffusion 和 Janus AI，实现无缝图像扩展

揭开历史面纱：将古代绘画转化为超现实照片

借助 Flux Diffusion 和多重条件引导，实现精准的 AI 图像编辑

释放 WanVideo 的强大功能：制作惊艳的贴纸撕裂效果视频

释放 AI 驱动的视频角色重绘能力：用风格化效果焕新视频画面

解锁电影级画质掌控力：超高清摄影工作流程揭秘

解锁专业级人像编辑：AI 驱动的工作流程助你轻松上手

解锁 AI 视频生成的强大力量：全面工作流程指南

绽放之美：建筑花开特效的技术指南

古韵之美生成揭秘：Stable Diffusion 搭配 SUPIR 的强强联合

释放创意视频生成力：运用 LoRA 特效实现物品装入礼盒的视觉效果

借助 Wan2.1、RIFE 与 CR 超分辨率，全面提升你的视频创作能力

解锁高效图像生成：全流程工作指南

从照片到艺术杰作：结合 ControlNet 与 LoRA 的风格化图像生成工作流程

探索 AI 艺术生成的魔力：一步步教你掌握完整工作流程

探索古代中国美人图片创作流程

探索对口型同步的卡通头像视频工作流程

CN

ComfyUI.org

2025-04-02 10:33:01

轻松生成对口型同步的卡通头像视频！学习如何使用 SVD XT 1.1、SONIC UNet 和 VHS Video 插件在几分钟内创建 10 秒视频。探索工作流程和关键节点，以生成高质量效果。立即开始吧！

使用场景: Video
适用场景: Video
显存: 低显存（≤8GB）
阅读时间: 3 分钟

更多 Video 工作流

工作流概览

轻松生成对口型同步的卡通头像视频！学习如何使用 SVD XT 1.1、SONIC UNet 和 VHS Video 插件在几分钟内创建 10 秒视频。探索工作流程和关键节点，以生成高质量效果。立即开始吧！

内容类型: Workflow

主要用途: Download

配置说明

打开工作流模板前，请先安装所需模型。
推荐硬件：低显存（≤8GB）。

1. 工作流概述

m8zsh97nggs2v1okatf2090560740d3541f2208f82b2f09965c34ae4604b1fe4946bd6f83153ef720d.gif

该工作流用于生成带口型同步的卡通人物视频（如Sonic数字人），支持任意分辨率输入。核心功能是通过音频驱动图像中人物的嘴部动作，生成10秒左右的视频（4090显卡约需8分钟渲染）。

2. 核心模型

模型/插件	功能说明	来源/安装方式
SVD XT 1.1	基础视频生成模型	需下载`svd_xt_1_1`模型文件
SONIC 定制模型	口型同步专用UNet	需加载`unet.pth`文件
VHS Video	视频合成插件	通过ComfyUI Manager安装

3. 关键组件

组件名称	功能说明	安装方式	依赖项
`ImageOnlyCheckpointLoader`	加载基础模型	内置节点	SVD XT 1.1模型文件
`SONICTLoader`	加载口型同步专用UNet	需手动安装SONIC插件	`unet.pth`文件
`SONIC_PreData`	预处理音频和图像数据	同SONIC插件	CLIP视觉编码器
`VHS_VideoCombine`	合成视频与音频	安装`ComfyUI-VideoHelperSuite`	FFmpeg环境

4. 工作流结构

Group 1: 数据加载
- 输入：
  - 图像（如45b437ee...png）
  - 音频（如10s-aijuxi.wav）
- 输出：预处理后的音频图像数据
- 关键节点：LoadImage, LoadAudio, SONIC_PreData
Group 2: 口型同步生成
- 输入：预处理数据 + 模型
- 输出：带口型的帧序列
- 关键节点：SONICSampler（控制生成帧率和种子值）
Group 3: 视频合成
- 输入：帧序列 + 原始音频
- 输出：MP4视频（H.264编码）
- 关键节点：VHS_VideoCombine

5. 输入与输出

输入参数：
- 图像：1080x1920 PNG（需包含清晰嘴部）
- 音频：10秒WAV文件
- 帧率：默认25 FPS（可调）
- 种子值：支持随机或固定（如837794266）
输出结果：
- MP4视频（路径如output/Sonic/aijuxi_xxxx.mp4）

6. 注意事项

⚠️ 硬件要求：需NVIDIA显卡（建议4090，显存≥16GB）
⚠️ 模型准备：
- 将svd_xt_1_1模型放入models/checkpoints
- unet.pth需放在SONIC插件指定路径
✅ 优化建议：
- 缩短音频时长可减少生成时间
- 降低SONICSampler的weight_dtype为fp16加速推理

常见问题

解锁文本生成视频的强大能力，体验阿里云Wan2.1模型

通过基于 Wan 模型的工作流程解锁高级视频深度控制

摘要

轻松生成对口型同步的卡通头像视频！学习如何使用 SVD XT 1.1、SONIC UNet 和 VHS Video 插件在几分钟内创建 10 秒视频。探索工作流程和关键节点，以生成高质量效果。立即开始吧！

章节

workflow:

CustomNodes:

ImageOnlyCheckpointLoader VHS_...