解锁图像动画的力量:将静态肖像转变为动态视频

CN
ComfyUI.org
2025-04-23 10:19:17

使用 Wan 图像转视频工作流程,将静态图像转变为动态视频。学习如何创造自然的动感并保留原始细节。现在就开始吧

使用场景
Video
适用场景
Video
模型
Wan2.1
显存
低显存(≤8GB)
阅读时间
3 分钟
查看所需模型更多 Video 工作流

工作流概览

使用 Wan 图像转视频工作流程,将静态图像转变为动态视频。学习如何创造自然的动感并保留原始细节。现在就开始吧

内容类型: Workflow

主要用途: Download

所需模型

  • Wan2.1

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:低显存(≤8GB)。

1. 工作流概述

m9ts8p9fqzdttw0ec3a1bc5237b526819f4010b72ac6ff7f02d990e4804c6ffdd0ac0797f342e4942b6.gif

这是一个名为"万相图转视频"的AI动态化流程,可将静态图片转化为动态视频(如让人物微笑/转头)。基于Wan 2.1图像转视频专用模型,核心功能包括:

  • 保持原图主体细节

  • 生成自然运动效果(如面部表情变化)

  • 输出720P高清视频(24FPS)

2. 核心模型

  • 主模型: wan2.1-i2v-14b-720p-Q4_K_M.gguf(量化版,4bit精度)

  • CLIP视觉编码器: clip_vision_h.safetensors(图像特征提取)

  • VAE: wan_2.1_vae.safetensors(视频专用解码器)

3. 关键组件

组件名称

功能说明

安装方式

WanImageToVideo

图像动态化核心节点

ComfyUI-Wan扩展

Anything Everywhere3

全局模型连接控制器

cg-use-everywhere插件

VAEDecodeTiled

分块解码降低显存占用

ComfyUI内置

特殊依赖:

  • 示例图片1.png(需放入输入文件夹)

  • umt5-xxl-encoder文本编码器(GGUF格式)

4. 工作流结构

阶段1: 模型加载

  • 加载Wan系列模型(UNet/CLIP/VAE)

  • 初始化CLIP视觉编码器

阶段2: 条件编码

  • 正面提示词控制动作(如"慢慢转头微笑")

  • 负面提示词过滤静态/低质量帧

阶段3: 视频生成

  • 使用uni_pc采样器(20步)

  • 通过VHS_VideoCombine合成MP4视频

5. 输入/输出

  • 必要输入:

    • 静态图片(如人物肖像)

    • 动作描述提示词(英文)

  • 输出:

    • 720P MP4视频(保存为wan_i2v_xxxx.mp4

6. 注意事项

⚠️ 硬件要求:

  • 需8GB以上显存(GGUF模型已做量化优化)

  • 推荐使用NVIDIA 30/40系列显卡

💡 优化技巧:

  • 修改VAEDecodeTiled的块大小可平衡速度与质量

  • 负面提示词中的"静止"相关词汇可减少卡顿帧

常见问题