解锁液态魔法:打造惊艳视觉特效的高级图像转视频(I2V)工作流程

CN
ComfyUI.org
2025-05-09 08:29:50

使用 I2V 工作流程生成震撼的液体碰撞视频!探索如何将 WanVideo 的自定义模型与 GIMM-VFI 插帧技术相结合,打造令人惊叹的视觉特效。立即学习并开启你的创作之旅!

使用场景
Video
适用场景
Video
显存
中等显存(12–16GB)
阅读时间
3 分钟
查看所需模型更多 Video 工作流

工作流概览

使用 I2V 工作流程生成震撼的液体碰撞视频!探索如何将 WanVideo 的自定义模型与 GIMM-VFI 插帧技术相结合,打造令人惊叹的视觉特效。立即学习并开启你的创作之旅!

内容类型: Workflow

主要用途: Download

所需模型

  • Wan2.1
  • Lora

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:中等显存(12–16GB)。

1. 工作流概述

magjdbeo7p13swo899j3307362b665ba4475ae5aa50fd81f0bd7c44db4c9d791fe94f0d49861cd9db88.gif

该工作流专为图像到视频生成(I2V)设计,核心功能是通过输入静态图像(如紫色电视机)生成动态视频,模拟液体碰撞飞溅的物理效果。工作流结合了万相视频(WanVideo)的定制模型和GIMM-VFI插件的帧插值技术,最终输出MP4视频或GIF动画。


2. 核心模型

  • Wan2.1-I2V-14B模型

    • 功能:基于图像生成视频潜变量(Latent),支持720P分辨率。

    • 来源:需下载Wan2_1-I2V-14B-720P_fp8_e4m3fn.safetensors,使用BF16精度。

  • UMT5-XXL文本编码器

    • 功能:将中文提示词(如“液体碰撞飞溅”)编码为向量。

    • 来源:模型文件umt5-xxl-enc-bf16.safetensors

  • GIMM-VFI模型

    • 功能:通过帧插值提升视频流畅度,需下载gimmvfi_r_arb_lpips_fp32.safetensors


3. 关键组件

组件名称

功能说明

安装方式

WanVideoBlockSwap

动态调整模型块以优化显存使用

通过ComfyUI-WanVideoWrapper安装

WanVideoLoraSelect

加载LoRA适配器(如液体特效LoRA)

同上

GIMMVFI_interpolate

对生成视频进行帧插值

需安装ComfyUI-GIMM-VFI插件

VHS_VideoCombine

将图像序列合成为MP4/GIF

安装ComfyUI-VideoHelperSuite


4. 工作流结构

  • Group 1: 模型与编码器加载

    • 输入:模型文件、LoRA适配器、文本编码器。

    • 输出:初始化完成的模型和编码器实例。

  • Group 2: 文本与图像编码

    • 输入:中文提示词(正面/负面)、输入图像(1024x1440 PNG)。

    • 输出:文本向量和图像嵌入(Embeddings)。

  • Group 3: 视频生成与插值

    • 输入:编码后的向量+种子值(如1032809127571661)。

    • 输出:插值后的视频帧序列(分辨率272x272)。


5. 输入与输出

  • 必要输入

    • 图像:需包含主体(如电视机),背景需简洁。

    • 提示词:正面提示需描述液体效果(示例:“透明液体碰撞飞溅”),负面提示需排除干扰词(如“变色”“镜头切换”)。

    • 种子值:可固定(如1032809127571661)或随机。

  • 输出

    • 默认生成MP4视频(NVENC H.264编码,30FPS),可选GIF格式。


6. 注意事项

  1. 硬件要求

    • 显存≥12GB(推荐RTX 3090及以上),因UMT5-XXL和Wan2.1模型较大。

  2. 常见错误

    • 显存不足:降低分辨率(如720→480)或关闭teacache_args的显存优化。

    • 插件缺失:确保安装ComfyUI-WanVideoWrapperComfyUI-GIMM-VFI

  3. LoRA适配器

    • 需单独下载WAN2.1 ZOEY 液体碰撞溅射_Alpha.safetensors,权重设为1.0。

常见问题