从人类到机甲:深入探讨 WAN2.1 视频模型工作流程

CN
ComfyUI.org
2025-04-23 10:27:24

使用我们基于 WAN2.1 视频模型的工作流程,将肖像转变为史诗级机甲战士视频。学习如何保留背景、实现平滑变形,并优化 720P 输出。通过我们的逐步指南开始吧!

使用场景
Video
适用场景
Video
显存
低显存(≤8GB)
阅读时间
2 分钟
查看所需模型更多 Video 工作流

工作流概览

使用我们基于 WAN2.1 视频模型的工作流程,将肖像转变为史诗级机甲战士视频。学习如何保留背景、实现平滑变形,并优化 720P 输出。通过我们的逐步指南开始吧!

内容类型: Workflow

主要用途: Download

所需模型

  • Wan2.1
  • Lora

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:低显存(≤8GB)。

1. 工作流概述

m9tsj0llqcohcllxgj829fa6cd2352c8196555ee2de857ebc6a934eba2db10ae6325a50b3a2549064e.gif

这是一个基于WAN2.1视频生成模型的"变身机甲"特效工作流,可将人物图像动态转化为机甲战士视频。核心功能包括:

  • 保持原始背景稳定

  • 实现人物到机甲的平滑变形

  • 支持720P分辨率输出(16FPS)

2. 核心模型

  • 主模型: Wan2_1-I2V-14B-720P_fp8_e4m3fn.safetensors(FP8优化版)

  • LoRA: WAN2.1 I2V 变身机甲(专用于机甲变形特效)

  • VAE: Wan2_1_VAE_fp32.safetensors(视频专用解码器)

3. 关键组件

组件名称

功能说明

安装方式

WanVideoBlockSwap

动态块替换技术(减少显存占用)

ComfyUI-WanVideoWrapper

WanVideoTeaCache

时序一致性缓存(防画面闪烁)

同扩展包内置

VHS_VideoCombine

视频帧合成(带CRF19压缩)

Video Helper Suite插件

特殊依赖:

  • 文本编码器umt5-xxl-enc-bf16.safetensors

  • CLIP视觉模型open-clip-xlm-roberta-large-vit-huge-14_visual_fp16

4. 工作流结构

阶段1: 模型加载

  • 加载WAN2.1三件套(UNet/CLIP/VAE)

  • 注入机甲变身LoRA(强度1.0)

阶段2: 条件控制

  • 正面提示词:"美女穿上机甲"(固定背景)

  • 负面提示词过滤变形瑕疵(如"肢体错乱")

阶段3: 视频渲染

  • 使用dpm++采样器(20步)

  • 通过TeaCache确保时序稳定性

5. 输入/输出

  • 必要输入:

    • 人物肖像图(如示例中的ComfyUI_temp_koggf_00017_.png

    • 固定种子值884841285240243

  • 输出:

    • 720P MP4视频(WanVideo2_1_xxxx.mp4

6. 注意事项

⚠️ 硬件要求:

  • 需16GB以上显存(FP8模型优化后)

  • 推荐使用NVIDIA A100/4090显卡

💡 优化技巧:

  • 修改WanVideoSLG中的引导尺度(0.8)可控制变形强度

  • 降低frame_rate到12可减少显存占用


常见问题