ElevenLabs 现已在 ComfyUI 上提供

CN
2026-03-08 02:01:26

世界级语音克隆、文本转语音和音效生成

使用场景
Video
适用场景
Video
阅读时间
2 分钟
更多 Video 工作流

工作流概览

世界级语音克隆、文本转语音和音效生成

内容类型: Workflow

配置说明

  • 打开工作流模板前,请先安装所需模型。

我们很高兴地通知您,ElevenLabs 已经通过合作伙伴节点集成到 ComfyUI 中!这将高级语音 AI 直接带入您的节点界面 —— 消除了外部工具和浏览器标签切换;只需拖动、连接和执行。

无论是开发播客系统、向 AI 创建的视频添加旁白、从杂乱的音频中提取对话,还是为角色复制语音,所有任务现在都可以直接在您的工作区中完成。


ElevenLabs 节点

🗣️ 文本转语音

输入提示以接收合成语音。从文本创建真实音频 —— 适合旁白、评论和自动音轨。与视频生成节点集成以实现无缝内容制作。

🔄 语音转语音

提供一段语音录音以输出变换版本。改变风格、语气或身份,同时保留原始节奏和感觉。适合配音、表演和创意修改。

📝 语音转文本

在您的流程中将音频转换为文本。用于字幕、将对话输入LLM分析或构建响应语音输入的音频到文本到图像序列。

🎧 声音隔离

通过分离声音和背景干扰来清理嘈杂的录音。适合于改进现场捕获或在进一步处理之前分离清晰的语音。

💬 文本到对话

从文本创建多语音对话。分配不同的语音、管理互动并产生栩栩如生的对话 — 适合播客、有声书、教育内容或游戏脚本。

🔊 文本到音效

描述声音以生成它。爆炸、脚步声、雨、科幻氛围 — 您的项目所需的任何内容。适合为视频添加氛围、构建声音景观或在没有样本库的情况下构建游戏音频的原型。

🎛️ 语音选择器

从 ElevenLabs 的预制语音库中选择。立即选择合适的语调、口音和风格,无需设置。


这很重要

音频通常是 ComfyUI 工作流中缺失的元素。虽然可以生成图像、视频、3D 资产和文本,但语音合成需要单独的步骤。现在,通过 ElevenLabs 作为合作伙伴节点,您可以建立全面的多模式管道:

  • 提示 → 图像 → 视频 → 语音 — 完全在一个图表中

  • 音频清理 → 转录 → 语言模型处理 — 无需导出或更改上下文

  • 生成对话 → 覆盖在生成的视频上 — 字符序列

这些节点与其他合作伙伴节点一起工作,允许同时生成和快速迭代。


开始

  1. 更新 将ComfyUI或ComfyUI Desktop更新到最新版本。

  2. 定位 在节点库或模板边栏中找到 ElevenLabs 节点。

  3. 放置一个节点在你的画布上并开始创作。

祝你创作愉快!

常见问题