释放AI力量:混元视频模型工作流全面解析
使用混元视频模型解锁动态视频创作!通过图像和文本提示生成高质量广告、短片与场景。学习如何运用这一强大工作流,立即开启创作之旅!
- 使用场景
- Video
- 适用场景
- Video
- 显存
- 低显存(≤8GB)
- 阅读时间
- 3 分钟
工作流概览
使用混元视频模型解锁动态视频创作!通过图像和文本提示生成高质量广告、短片与场景。学习如何运用这一强大工作流,立即开启创作之旅!
内容类型: Workflow
主要用途: Download
配置说明
- 打开工作流模板前,请先安装所需模型。
- 推荐硬件:低显存(≤8GB)。
1. 工作流概述

该工作流基于 混元视频模型(Hunyuan Video Model),支持多主题视频生成,结合 图像参考 和 文本提示,生成高质量动态视频内容。适用于广告、创意短片、多镜头场景合成等需求。
2. 核心模型
主模型:
hunyuan_video_custom_720p_fp8_scaled.safetensors功能:视频生成核心模型,支持动态帧插值和风格迁移。
VAE 模型:
hunyuan_video_vae_bf16.safetensors功能:视频隐变量解码,优化画面细节。
CLIP 模型:
clip_l.safetensors+llava_llama3_fp8_scaled.safetensors功能:多模态文本-图像对齐,增强提示词控制。
3. 关键组件(Nodes)
HyVideoModelLoader
作用:加载混元视频主模型,支持
bf16/fp8精度。安装:需通过 ComfyUI-HunyuanVideoWrapper 插件安装。
HyVideoVAELoader
作用:加载视频专用 VAE,提升解码质量。
HyVideoSampler
作用:控制视频生成参数(分辨率
832x480、帧率24fps、采样器FlowMatchDiscreteScheduler)。
HyVideoEncode 与 HyVideoDecode
功能:视频隐变量编码与解码,支持动态分辨率调整。
VHS_VideoCombine
作用:合成最终视频(支持 MP4/H.264 格式,CRF 质量参数
19)。安装:需 ComfyUI-VideoHelperSuite 插件。
ImageConcatMulti
作用:多图像横向/纵向拼接,用于多主题画面合成。
4. 工作流结构(Group 分组)
参数区:
设置视频分辨率(如
896x512)、提示词(如“Realistic, High-quality. a women holde the bag”)、负面提示词(如“低质量、变形”)。
单主题视频组:
包含完整的视频生成链:模型加载 → 文本/图像条件编码 → 视频采样 → 解码 → 合成。
5. 输入与输出
输入参数:
图像参考(支持透明背景处理,如
RMBG-1.4去背)。文本提示词、分辨率、帧数(默认
85帧)。
输出结果:
视频文件(如
pl-custom_00001.mp4),格式为H.264/MP4,帧率24fps。
6. 注意事项
模型依赖:
需下载混元视频模型和插件(HunyuanVideoWrapper、VideoHelperSuite)。
性能要求:
显存 ≥16GB,推荐使用
bf16精度以平衡速度与质量。
常见问题:
视频卡顿?尝试降低分辨率或减少帧数。
画面模糊?检查 VAE 解码参数或提示词细节。