LTX-2 在 ComfyUI 上天然支持 Day 0
大家好!
- 使用场景
- Video
- 适用场景
- Video
- 阅读时间
- 4 分钟
工作流概览
大家好!
内容类型: Workflow
主要用途: Download
配置说明
- 打开工作流模板前,请先安装所需模型。
- 使用上方下载按钮将工作流 JSON 导入 ComfyUI。
大家好!我们很高兴地宣布,LTX-2, 一种公开可访问的音频视觉AI框架,已经直接集成到ComfyUI!
该模型在优化计算资源和处理速度的同时产生顶级的视觉效果。通过一步创建运动、语音、环境声音和音乐元素,它创造了统一的多媒体输出。开发者在其透明的架构中获得艺术灵活性。
模型的关键功能
LTX-2在ComfyUI中实现了同步音频视觉创作,通过多样化的输入方法,赋予场景以真实的动作和表情。它在标准硬件上高效运行。
可访问的音频视频核心框架
同时生产运动、语音、音效和音乐轨道
使用Canny、Depth和Pose技术的视频转换控制
关键帧引导的创建
集成分辨率增强和提示优化
示例结果
文本转视频
一个快乐的女孩木偶特写,头发是卷曲的棕色纱线,眼睛是宽大的按钮,头顶上举着一把小红伞,雨水从她身边轻轻落下,她抬头开始愉快地唱英语:“下雨了,下雨了,我喜欢下雨的时候。”她的织物嘴巴开合着优美的曲调,她的手握着伞柄,随着节奏轻轻摇摆,摄像机保持稳定,雨水在柔和的灯光下闪烁,她的眼睛偶尔眨动,唱歌时微微闭眼。一名身穿黑色燕尾服的男子站在一间小小的红色瓷砖浴室里,面对着镜子一动不动。摄像机紧跟在他的右肩后,捕捉到了他的背影和凝重的倒影。突然,他张开嘴开始用意大利语演唱歌剧:“La donna è mobile, qual piuma al vento.” 浓郁有力的声音在空间中回荡。当他的声音随着音调的升高而变得更加激情,几乎是脆弱的,他的眉毛也随之上扬。顶灯的光芒在他的脸上和燕尾服上投下了锐利的光环,照亮了他周围闪亮的红色瓷砖。摄像机保持静止将图像转换为视频

一张近距离拍摄的年轻女服务员在一家复古的50年代风格的餐厅里,她温暖的棕色眼睛与镜头相遇,带着温柔的微笑。她穿着黑白圆点的连衣裙,带有精致的乳白色蕾丝领口,她的栗色头发以复杂的发型打理,精致的卷发衬托着她满脸雀斑。从上方的照明装置照射下,温暖柔和的光线照亮了她的面容,她站在黄色的柜台后面。镜头从她的侧面开始慢慢推向她的脸,露出她脸颊上细微的玫瑰色的红晕。在模糊的背景中,柔和的青色墙壁和发光的红色“餐厅”的标志营造出怀旧的气氛。餐厅里盘子碰撞的声音,远处的交谈声,和轻柔的音乐机的嗡嗡声充满了空气。她微微地歪着头,用友好而温暖的声音说:“欢迎来到Rosie's,今天我可以为您提供什么?”整体氛围令人感到温馨,超越时空,充满了经典的美国餐厅魅力。

广阔的摄像机视角跟随一支山地自行车队在明亮的冬日里以高速穿越未被打扰的雪地。镜头保持与身穿鲜黄夹克、戴着橙色头盔的领先骑手保持速度,他们跳过一个雪堆,自行车悬挂在清澈的蔚蓝天空下。周围的冰晶粒子爆炸,捕捉到低太阳的金色光辉,产生了戏剧性的逆光和拉长的影子横跨整个景观。其他自行车手紧随其后,他们的剪影在滚动的山丘上激起了粉末状的雪花。 可以听到的声音包括自行车胎在压实的雪地上摩擦的声音、跳跃时的呼呼声和远处的粗重呼吸声与兴奋的喊声。
视频控制方法
获取LTX-2 Canny变换工作流
获取LTX-2深度转换工作流程
获取LTX-2姿势适应工作流程
初始步骤
确保您的ComfyUI更新到最新版本(桌面版和Comfy Cloud版将很快推出)
导航到模板库→视频→选择任意LTX-2框架
按照提示获取模型,验证所有输入并执行工作流程

祝创作愉快!