解锁惊艳的视频生成与风格控制:全面工作流程指南

CN
ComfyUI.org
2025-04-04 08:22:07

使用阿里巴巴的 InP 模型,解锁AI驱动的视频生成! 探索一套工作流程,为你的视频创作带来动态风格插值、多模态支持和细节增强。 了解如何利用 WanVideoBlockSwap 等强大工具 —— 点击立即探索!

使用场景
Video
适用场景
Video
模型
Wan2.1
显存
低显存(≤8GB)
阅读时间
4 分钟
查看所需模型更多 Video 工作流

工作流概览

使用阿里巴巴的 InP 模型,解锁AI驱动的视频生成! 探索一套工作流程,为你的视频创作带来动态风格插值、多模态支持和细节增强。 了解如何利用 WanVideoBlockSwap 等强大工具 —— 点击立即探索!

内容类型: Workflow

主要用途: Download

所需模型

  • Wan2.1

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:低显存(≤8GB)。

1. 工作流概述

m92iqyr2sbhydss6xbn752c2e3c58a9587e48b65a45d0c85c310ac340b45695409450773f81da64f6a7.gif

该工作流专为视频生成与风格控制设计,核心功能是通过输入首尾帧图像生成动态视频,并结合阿里云InP(智能处理)模型实现细节增强。主要特点:

  • 首尾帧驱动:以起始帧和结束帧为基础生成中间过渡帧。

  • FunControl技术:通过WanVideoBlockSwap节点实现动态风格插值。

  • 多模态支持:整合了CLIP视觉编码、T5文本编码和VAE解码。

核心模型

  • Wan2.1-Fun-InP-14B:14B参数的视频生成模型,支持FP8量化(需显存优化)。

  • umt5-xxl-enc:多语言T5文本编码器,处理复杂提示词。

  • OpenCLIP-ViT-H:视觉编码器,提取图像特征。


2. 组件说明

关键节点

  1. WanVideoModelLoader

    • 功能:加载主模型(Wan2.1-Fun-InP-14B_fp8_e4m3fn.safetensors)。

    • 安装:需手动下载模型并放入ComfyUI/models/wan_video/

    • 依赖:FP8量化需NVIDIA Ampere/Ada架构GPU。

  2. WanVideoClipVisionEncode

    • 功能:使用OpenCLIP编码首尾帧图像特征。

    • 模型open-clip-xlm-roberta-large-vit-huge-14_fp16.safetensors(HuggingFace下载)。

  3. WanVideoSampler

    • 功能:控制视频生成的采样步骤(30步)、CFG值(6)和运动强度(参数slg_args)。

  4. VHS_VideoCombine

    • 功能:将帧序列合成为MP4/GIF(支持H.264编码)。

    • 安装:需安装ComfyUI-VideoHelperSuite插件。


3. 工作流结构

分组逻辑

  • Group 1: 首尾帧处理

    • 输入:两张输入图像(通过LoadImage加载)。

    • 处理:调整分辨率至640x480(ImageResizeKJ),添加标签(AddLabel)。

  • Group 2: 视频生成

    • 输入:编码后的图像特征+文本提示(描述视频内容)。

    • 输出:潜空间序列(通过WanVideoDecode解码为图像帧)。

  • Group 3: 后期合成

    • 输出:最终视频(MP4/GIF)和中间预览(带元数据)。


4. 输入与输出

输入参数

  • 图像:首帧(start_frame)和尾帧(end_frame),建议480p以上。

  • 文本提示:英文描述(如示例中的“数字线框视频,人物持光剑”)。

  • 性能参数

    • teacache_args:显存优化(0.3阈值)。

    • experimental_args:实验性插值模式(2,3)。

输出结果

  • 视频文件:MP4(H.264)和GIF两种格式。

  • 中间帧:带标签的拼接预览图(显示首尾帧对比)。


5. 注意事项

  • 显存需求:至少16GB(FP8模式下需24GB)。

  • 模型兼容性

    • 若显存不足,可切换至1.3B模型(需修改WanVideoModelLoader配置)。

    • 缺失模型会触发控制台下载提示。

  • 错误排查

    • 首尾帧尺寸不一致会导致ImageConcatMulti报错。

    • 文本提示需避免中文(T5模型以英文训练)。

常见问题