释放AI力量:混元视频模型工作流全面解析

CN
ComfyUI.org
2025-05-14 14:08:21

使用混元视频模型解锁动态视频创作!通过图像和文本提示生成高质量广告、短片与场景。学习如何运用这一强大工作流,立即开启创作之旅!

使用场景
Video
适用场景
Video
显存
低显存(≤8GB)
阅读时间
3 分钟
更多 Video 工作流

工作流概览

使用混元视频模型解锁动态视频创作!通过图像和文本提示生成高质量广告、短片与场景。学习如何运用这一强大工作流,立即开启创作之旅!

内容类型: Workflow

主要用途: Download

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:低显存(≤8GB)。

1. 工作流概述

mao0noxkalai24s9ogi10bc69e740d42da14fffb75e57d73d62e844f4ea02bd04dadba2cb3e15ae28ae.gif

该工作流基于 混元视频模型(Hunyuan Video Model),支持多主题视频生成,结合 图像参考文本提示,生成高质量动态视频内容。适用于广告、创意短片、多镜头场景合成等需求。

2. 核心模型

  • 主模型hunyuan_video_custom_720p_fp8_scaled.safetensors

    • 功能:视频生成核心模型,支持动态帧插值和风格迁移。

  • VAE 模型hunyuan_video_vae_bf16.safetensors

    • 功能:视频隐变量解码,优化画面细节。

  • CLIP 模型clip_l.safetensors + llava_llama3_fp8_scaled.safetensors

    • 功能:多模态文本-图像对齐,增强提示词控制。

3. 关键组件(Nodes)

  1. HyVideoModelLoader

    • 作用:加载混元视频主模型,支持 bf16/fp8 精度。

    • 安装:需通过 ComfyUI-HunyuanVideoWrapper 插件安装。

  2. HyVideoVAELoader

    • 作用:加载视频专用 VAE,提升解码质量。

  3. HyVideoSampler

    • 作用:控制视频生成参数(分辨率 832x480、帧率 24fps、采样器 FlowMatchDiscreteScheduler)。

  4. HyVideoEncodeHyVideoDecode

    • 功能:视频隐变量编码与解码,支持动态分辨率调整。

  5. VHS_VideoCombine

    • 作用:合成最终视频(支持 MP4/H.264 格式,CRF 质量参数 19)。

    • 安装:需 ComfyUI-VideoHelperSuite 插件。

  6. ImageConcatMulti

    • 作用:多图像横向/纵向拼接,用于多主题画面合成。

4. 工作流结构(Group 分组)

  • 参数区

    • 设置视频分辨率(如 896x512)、提示词(如“Realistic, High-quality. a women holde the bag”)、负面提示词(如“低质量、变形”)。

  • 单主题视频组

    • 包含完整的视频生成链:模型加载 → 文本/图像条件编码 → 视频采样 → 解码 → 合成。

5. 输入与输出

  • 输入参数

    • 图像参考(支持透明背景处理,如 RMBG-1.4 去背)。

    • 文本提示词、分辨率、帧数(默认 85 帧)。

  • 输出结果

    • 视频文件(如 pl-custom_00001.mp4),格式为 H.264/MP4,帧率 24fps

6. 注意事项

  1. 模型依赖

  2. 性能要求

    • 显存 ≥16GB,推荐使用 bf16 精度以平衡速度与质量。

  3. 常见问题

    • 视频卡顿?尝试降低分辨率或减少帧数。

    • 画面模糊?检查 VAE 解码参数或提示词细节。

常见问题