ElevenLabs 现已在 ComfyUI 上提供
世界级语音克隆、文本转语音和音效生成
- 使用场景
- Video
- 适用场景
- Video
- 阅读时间
- 2 分钟
工作流概览
世界级语音克隆、文本转语音和音效生成
内容类型: Workflow
配置说明
- 打开工作流模板前,请先安装所需模型。
我们很高兴地通知您,ElevenLabs 已经通过合作伙伴节点集成到 ComfyUI 中!这将高级语音 AI 直接带入您的节点界面 —— 消除了外部工具和浏览器标签切换;只需拖动、连接和执行。
无论是开发播客系统、向 AI 创建的视频添加旁白、从杂乱的音频中提取对话,还是为角色复制语音,所有任务现在都可以直接在您的工作区中完成。
ElevenLabs 节点
🗣️ 文本转语音
输入提示以接收合成语音。从文本创建真实音频 —— 适合旁白、评论和自动音轨。与视频生成节点集成以实现无缝内容制作。
🔄 语音转语音
提供一段语音录音以输出变换版本。改变风格、语气或身份,同时保留原始节奏和感觉。适合配音、表演和创意修改。
📝 语音转文本
在您的流程中将音频转换为文本。用于字幕、将对话输入LLM分析或构建响应语音输入的音频到文本到图像序列。
🎧 声音隔离
通过分离声音和背景干扰来清理嘈杂的录音。适合于改进现场捕获或在进一步处理之前分离清晰的语音。
💬 文本到对话
从文本创建多语音对话。分配不同的语音、管理互动并产生栩栩如生的对话 — 适合播客、有声书、教育内容或游戏脚本。
🔊 文本到音效
描述声音以生成它。爆炸、脚步声、雨、科幻氛围 — 您的项目所需的任何内容。适合为视频添加氛围、构建声音景观或在没有样本库的情况下构建游戏音频的原型。
🎛️ 语音选择器
从 ElevenLabs 的预制语音库中选择。立即选择合适的语调、口音和风格,无需设置。
这很重要
音频通常是 ComfyUI 工作流中缺失的元素。虽然可以生成图像、视频、3D 资产和文本,但语音合成需要单独的步骤。现在,通过 ElevenLabs 作为合作伙伴节点,您可以建立全面的多模式管道:
提示 → 图像 → 视频 → 语音 — 完全在一个图表中
音频清理 → 转录 → 语言模型处理 — 无需导出或更改上下文
生成对话 → 覆盖在生成的视频上 — 字符序列
这些节点与其他合作伙伴节点一起工作,允许同时生成和快速迭代。
开始
更新 将ComfyUI或ComfyUI Desktop更新到最新版本。
定位 在节点库或模板边栏中找到 ElevenLabs 节点。
放置一个节点在你的画布上并开始创作。
祝你创作愉快!