HappyHorse 1.1 现在已经在 ComfyUI 上发布
具有对话、音效和多角色一致性的音频原生视频生成 - 直接集成到您的工作流程中。
- 使用场景
- Video
- 适用场景
- Video
- 阅读时间
- 2 分钟
工作流概览
具有对话、音效和多角色一致性的音频原生视频生成 - 直接集成到您的工作流程中。
内容类型: Workflow
主要用途: Tutorial
所需模型
- Happyhorse
配置说明
- 打开工作流模板前,请先安装所需模型。
HappyHorse 1.1版本的合作伙伴节点已在ComfyUI中发布。该视频模型面向专业生产场景,支持短剧集、在线购物促销、品牌广告和视频游戏剪辑场景。
一个关键方面是其集成的同步音频功能,可以同时生成对话、音效和音乐背景。
1.1版本的重点是五个关键的生产元素:生动的动作;角色描绘的统一性;指令的可靠性;文本的稳定显示;和电影的真实性。
1.1版本更新
动态表达性: 运动流畅性和帧对齐现在消除了v1.0中僵硬、无响应的动作。
增强的多图像参考能力: 输入细节准确维护,允许最多九个输入图像。
多字符可靠性: 有多个参考点,每个数字保持明确的外观,免受混合的影响。
可适应的角色场景配对: 将角色和环境作为不同的输入提供;数字在不断变化的背景下保持不变。
改进的命令解释:增强的长上下文记忆处理超过2500个字符的指令;一个提示可以概述6-8个顺序场景,具有自动计时和观点过渡。
逼真的纹理用于特写: 校正人造皮肤的光泽和过度的边缘定义,实现真实的表面效果,适用于广告和展览。
电影术语支持: 完全支持短语如交替镜头和跟踪摄影这使得过渡更加顺畅,节奏调整也更加方便。
增强音频生成:更加真实的对话和效果再现,融合情感深度和精确的音视频时序
统一模型的三个节点
HappyHorse 1.1提供了三个专业节点:
从文本创建场景:仅通过文本命令,开发整个环境,从零开始,管理美学,照明,动作和音频
静帧动画:由于视觉存在于初始图像中,只需描述运动和相机操作
多角色布景通过参考图像配角和设置,然后通过时间脚本序列指导他们,个别行。
所有方法支持720p/1080p输出,3-15秒时长和灵活的尺寸(16:9,9:16,1:1等),每次导出都能提供完美的音频时序。
开始流程
更新到ComfyUI的最新版本
访问HappyHorse节点使用"HappyHorse"在节点库中或选择预制蓝图。
选择你的方法选择文本到视频,图像到视频或参考到视频模式。在执行之前连接提示和参考图像。结果随着所选分辨率的音频嵌入而出现。