ACE-步骤 1.5 XL:商业级音乐生成舒适界面

CN
2026-04-18 02:02:43

一个4B参数的开源音乐模型,可以在几秒内生成完整的歌曲——在消费级硬件上本地运行

显存
高显存(24GB+)
阅读时间
2 分钟
下载工作流 JSON

工作流概览

一个4B参数的开源音乐模型,可以在几秒内生成完整的歌曲——在消费级硬件上本地运行

内容类型: Workflow

主要用途: Comparison

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:高显存(24GB+)。
  • 使用上方下载按钮将工作流 JSON 导入 ComfyUI。

音乐合成的格局已经经历了显著的提升。ACE-Step 1.5 XL在其结构中集成了一个40亿参数的扩散变压器解码器,在直接在离散图形硬件上运行的同时,实现了与高端商用系统相当的音频保真度。

共有三种专业版可供选择:xl-base优先考虑广泛的适应性,xl-sft在声学精度方面表现出色,和xl-turbo 最大化处理速度。每个迭代都在MIT许可条款下运行,并使用合法授权的训练数据集。

工具性黑暗合成波
具有女性人声的旋律Dubstep
具有女性人声的环境电子

基本属性

  • 专业级输出 – 统计评估结果位于Suno v4.5和v5版本之间,具有4B参数的结果比以前的2B配置产生更丰富的音频质地

  • Rapid Synthesis Capability – 使用A100硬件在不到2秒内生成完整的音乐作品,或在RTX 3090系统上生成不到10秒的音乐。 xl-turbo变体将处理减少到仅8步(与基本版/ sft版相比约6倍加速)

  • 可适应的作曲长度 – 创建从简短的10秒音符到全面10分钟的安排

  • 扩大的声音调色板 – 使用1000多种不同的音色跨越众多音乐类型的音调特征的细粒度控制

  • 多语言歌词集成 – 使用50多种语言的歌词提示进行结构和风格操作

  • 商业使用授权– MIT 许可框架,利用免版税材料、公共领域资源和 MIDI 数据的合成音频转换

模型选择

所有三个 XL 版本共享相同的 4B 参数框架:
XL-Base– 创意探索的首选之选
下载工作流程

XL-SFT – 优化音频细化,适度降低多样性
下载工作流程

XL-Turbo – 为加速迭代流程进行优化的8步处理
下载工作流程

实现过程

  1. 获取更新的ComfyUI版本

  2. 访问模板仓库并使用“ACE步骤”术语进行搜索

  3. 选择对应的工作流程结构

  4. 按照嵌入的指南获取必要的模型

  5. 修改提示并执行生成序列

享受您的创意探索过程!

常见问题