解锁动漫风格视频魔法:WAN2.1逐步工作流指南

CN
ComfyUI.org
2025-03-27 12:24:49

使用WAN2.1模型生成动漫风格视频:学习如何将输入视频转换为动漫风格,结合动态提示词与HunyuanLoom技术,输出16fps的MP4视频。立即尝试这个工作流!

使用场景
Video
适用场景
Video
模型
Wan2.1
显存
低显存(≤8GB)
阅读时间
3 分钟
查看所需模型更多 Video 工作流

工作流概览

使用WAN2.1模型生成动漫风格视频:学习如何将输入视频转换为动漫风格,结合动态提示词与HunyuanLoom技术,输出16fps的MP4视频。立即尝试这个工作流!

内容类型: Workflow

主要用途: Download

所需模型

  • Wan2.1

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:低显存(≤8GB)。
  • 使用上方下载按钮将工作流 JSON 导入 ComfyUI。

1. 工作流概述

m8rbu2yd49evye0j6g493dbf108f0ebe5a132c3f339d783763ddd6b8b95d58b4ff6236d50a70a21b167.png

这是一个基于WAN2.1模型的AI视频生成工作流(大凯优化版),专为动漫风格视频转绘设计。核心功能包括:

  • 将输入视频(如dance.mp4)转换为动漫风格

  • 支持动态提示词控制角色细节(19岁中国女学生JK制服舞蹈)

  • 使用HunyuanLoom技术优化动作连贯性

  • 输出16fps的MP4视频(H.264编码)

2. 核心模型

模型名称

功能描述

wan2.1_t2v_1.3B_fp16

视频生成主模型(1.3B参数)

umt5_xxl_fp16

多语言CLIP文本编码器

wan_2.1_1.3b_vae

轻量化VAE,优化色彩还原

4x-UltraSharp

(可选)超分辨率模型

3. 关键组件

特色节点

  • VHS_LoadVideo:视频帧提取(跳过前120帧,保留81帧)

  • HYFlowEditGuiderCFG:动态条件引导(CFG=7.5)

  • SamplerCustomAdvanced:高级采样器(16步,simple调度器)

  • VAEDecodeTiled:分块解码(512x512分块,64px重叠)

依赖安装

  1. Video Helper Suite:通过ComfyUI Manager安装comfyui-videohelpersuite

  2. HunyuanLoom插件:手动安装ComfyUI-HunyuanLoom(GitHub)

  3. WAN2.1模型:需单独下载并放入models文件夹

4. 工作流结构

Group 1: 载入模型

  • 加载UNET/CLIP/VAE模型(wan2.1_t2v_1.3B_fp16 + umt5_xxl_fp16

  • 应用ApplyTeaCachePatch加速推理(强度0.1)

Group 2: 提示词输入

  • 正面提示词:详细描述角色服饰/动作/背景(琥珀色眼睛、JK制服、海滩日落)

  • 负面提示词:过滤写实/低质量内容(共60条限制词)

  • 通过FluxGuidance增强提示词权重

Group 3: 视频输入区

  • 输入视频缩放至832x480(nearest-exact算法)

  • 分块编码潜空间(VAEEncodeTiled

Group 4: 采样和视频生成

  • 使用HYFlowEditSampler(seed=123478)生成潜空间

  • 分块解码+视频合成(CRF=19,yuv420p格式)

5. 输入与输出

输入参数

  • 视频文件(默认dance.mp4

  • 正面/负面提示词(已预设)

  • 帧率(16fps)

输出结果

  • MP4视频(如hyloom_00003.mp4

  • 保留中间帧(可选)

6. 注意事项

  • 显存需求:建议16GB+显存(1.3B模型显存占用高)

  • 视频限制:输入视频需≥1280x720,时长≤30秒

  • 动作优化:如出现抖动,调整HYFlowEditGuiderCFGmotion_coherence参数

  • 常见错误:缺少umt5_xxl_fp16模型会导致CLIP编码失败

常见问题