解锁 Wan2.1 的强大能力:生成带有召唤特效的动态化身视频

CN
ComfyUI.org
2025-04-29 09:57:42

使用 Wan2.1-I2V-14B 模型,解锁动态视频生成能力!学习如何通过文本提示、输入图像和自定义 LoRA,打造惊艳的『化身召唤』特效。了解完整工作流程、核心模型及关键节点,立即开始创作!

使用场景
Video
适用场景
Video
模型
Wan2.1
显存
低显存(≤8GB)
阅读时间
3 分钟
查看所需模型更多 Video 工作流

工作流概览

使用 Wan2.1-I2V-14B 模型,解锁动态视频生成能力!学习如何通过文本提示、输入图像和自定义 LoRA,打造惊艳的『化身召唤』特效。了解完整工作流程、核心模型及关键节点,立即开始创作!

内容类型: Workflow

主要用途: Download

所需模型

  • Wan2.1

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:低显存(≤8GB)。

1. 工作流概述

ma2c3nfww31nz5kvkei2917e9a1ef66f5047bad22ad6b534bbf1c8b30d3643181f48bfbd47e676683ac.gif

这是一个基于 Wan2.1-I2V-14B 模型的视频生成工作流,专门用于生成具有 “法相天地”特效的动态视频(例如:人物动作触发半透明虚影特效)。核心功能是通过 文本提示 + 输入图像 驱动视频生成,并融合了自定义的 LoRA 模型(如法阵特效、动作同步等)。

2. 核心模型

  • Wan2.1-I2V-14B-480P_fp8_e4m3fn.safetensors

    • 主模型,负责视频生成,支持图像到视频(I2V)的转换。

    • 依赖 BF16 精度,需高显存(建议 16GB+ GPU)。

  • umt5-xxl-enc-bf16.safetensors

    • T5 文本编码器,用于解析复杂的文本提示(如中文长描述)。

  • Wan2.1_VAE_bf16.safetensors

    • VAE 模型,负责潜在空间到图像的解码。

3. 关键组件

  • WanVideoModelLoader

    • 加载主模型,需手动下载模型文件并放置到 ComfyUI/models/wan_video

  • WanVideoTextEncode

    • 结合 T5 编码器处理文本提示(如正/负提示词)。

  • WanVideoSampler

    • 采样器(DPM++ SDE),控制生成步骤(默认 25 步)和种子值。

  • WanVideoLoraSelect

    • 加载自定义 LoRA(如 法相天地_beta),增强特效表现。

  • VHS_VideoCombine

    • 将生成的帧序列合成为 MP4 视频(默认 16 FPS)。

4. 工作流结构

  1. 输入组

    • 文本输入:通过 WanVideoTextEncode 处理提示词(如“女人挥舞长刀,生成紫色武士虚影”)。

    • 图像输入:通过 LoadImage 加载参考图(如“修仙女子.png”)。

  2. 生成组

    • 模型加载WanVideoModelLoaderWanVideoVAELoader 初始化模型。

    • 采样生成WanVideoSampler 结合文本和图像嵌入生成潜在视频帧。

  3. 输出组

    • 视频合成VHS_VideoCombine 输出最终 MP4 文件(分辨率 480x832)。

5. 输入与输出

  • 输入

    • 文本提示(中英文均可)、参考图像、种子值(如 1057359483639287)。

  • 输出

    • MP4 视频(H.264 编码,带元数据)。

6. 注意事项

  • 模型依赖:需手动下载 Wan2.1 系列模型和 LoRA,放置到正确路径。

  • 显存要求:建议 16GB+ GPU,BF16 模式可降低显存占用。

  • 兼容性:仅支持 ComfyUI-WanVideoWrapper 插件(需通过 ComfyUI Manager 安装)。

  • 常见错误

    • 缺少模型文件时会报错 FileNotFoundError

    • 分辨率过高可能导致 CUDA OOM,可调整 WanVideoBlockSwap 中的参数。

常见问题