探索生成烹饪猫咪视频的工作流程

CN
ComfyUI.org
2025-04-08 11:47:24

"使用 Wan2.1 多元宇宙打造 viral 抖音视频:动态图像到视频工作流,制作烹饪猫咪视频。学习如何通过 LoRA 微调和帧插值生成 4K 风格化视频。现在就尝试这个工作流!"

使用场景
Video
适用场景
Video
关键节点
Upscaler
显存
中等显存(12–16GB)
阅读时间
3 分钟
查看所需模型更多 Video 工作流

工作流概览

"使用 Wan2.1 多元宇宙打造 viral 抖音视频:动态图像到视频工作流,制作烹饪猫咪视频。学习如何通过 LoRA 微调和帧插值生成 4K 风格化视频。现在就尝试这个工作流!"

内容类型: Workflow

主要用途: Download

所需模型

  • Wan2.1
  • Lora

所需节点

  • Upscaler

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:中等显存(12–16GB)。

1. 工作流概述

m98fslqfvlt4y8etc7l1444529fea95307e53cfb766cd5384e4a5283a45e764ac80671d003b91cf3997.gif

这是一个专为抖音设计的猫咪煮饭爆款视频生成工作流,基于Wan2.1万相模型实现图生视频功能。核心特点包括:

  • 从单张图片生成动态视频(如猫咪烹饪场景)

  • 支持LoRA微调(如"胖猫师傅"风格)

  • 4K超分辨率放大(使用4x-UltraSharp模型)

  • RIFE光流补帧(10倍插值)

  • 多格式输出(MP4 + GIF)

2. 核心模型

模型名称

功能说明

来源/安装方式

Wan2.1-I2V-14B

图像转视频主模型(FP8量化)

需手动下载.safetensors文件

胖橘做饭_MZF04 LoRA

猫咪厨师风格微调

需通过LoraLoader节点加载

4x-UltraSharp

超分辨率模型

ComfyUI Manager搜索安装

RIFE 4.7

补帧模型(10倍插值)

需下载rife47.pth权重文件

3. 关键组件

组件名称

功能说明

安装方式

WanVideoImageClipEncode

将输入图像编码为视频潜在空间

需安装ComfyUI-WanVideoWrapper

WanVideoSampler

控制视频生成的采样过程(15步)

同上

RIFE VFI

视频插帧(10倍补帧)

需安装ComfyUI-VideoHelperSuite

ImageResizeAdvanced

动态调整输入图像分辨率

内置节点

4. 工作流结构

  • Group 1: 图像输入处理

    • 输入:1152x2048 PNG图像(猫咪厨师)

    • 节点:LoadImageImageResizeAdvanced(调整为1024x1024)

  • Group 2: 视频生成

    • 核心节点:

      • WanVideoImageClipEncode(图像编码)

      • WanVideoSampler(DPM++采样,15步)

      • WanVideoDecode(解码为图像序列)

  • Group 3: 后处理

    • 超分:ImageUpscaleWithModel(4x放大)

    • 补帧:RIFE VFI(插值10帧)

    • 输出:VHS_VideoCombine(MP4 24fps)

5. 输入与输出

  • 输入参数

    • 必填:

      • 输入图像(推荐1152x2048比例)

      • 提示词(如"小猫正在拿勺子吃美食")

    • 可选:

      • 种子值(默认随机)

      • LoRA强度(默认0.9)

  • 输出结果

    • WanVideo2_1.mp4(H.264编码,24fps)

    • 超分后的GIF动图

6. 注意事项

  • 显存需求:建议≥12GB GPU(启用fp8_e4m3fn量化后可降低需求)

  • 特色功能

    • 通过胖橘做饭_MZF04 LoRA实现抖音爆款猫咪厨师风格

    • 注释节点提示:"sdpa/flaash优化选项需测试"

  • 常见问题

    • 图像尺寸需匹配ImageResizeAdvanced节点的比例锁定设置

    • 补帧失败时检查rife47.pth路径

常见问题