ACE-步骤 1.5 XL:商业级音乐生成舒适界面
一个4B参数的开源音乐模型,可以在几秒内生成完整的歌曲——在消费级硬件上本地运行
- 显存
- 高显存(24GB+)
- 阅读时间
- 2 分钟
工作流概览
一个4B参数的开源音乐模型,可以在几秒内生成完整的歌曲——在消费级硬件上本地运行
内容类型: Workflow
主要用途: Comparison
配置说明
- 打开工作流模板前,请先安装所需模型。
- 推荐硬件:高显存(24GB+)。
- 使用上方下载按钮将工作流 JSON 导入 ComfyUI。
音乐合成的格局已经经历了显著的提升。ACE-Step 1.5 XL在其结构中集成了一个40亿参数的扩散变压器解码器,在直接在离散图形硬件上运行的同时,实现了与高端商用系统相当的音频保真度。
共有三种专业版可供选择:xl-base优先考虑广泛的适应性,xl-sft在声学精度方面表现出色,和xl-turbo 最大化处理速度。每个迭代都在MIT许可条款下运行,并使用合法授权的训练数据集。
工具性黑暗合成波
具有女性人声的旋律Dubstep
具有女性人声的环境电子
基本属性
专业级输出 – 统计评估结果位于Suno v4.5和v5版本之间,具有4B参数的结果比以前的2B配置产生更丰富的音频质地
Rapid Synthesis Capability – 使用A100硬件在不到2秒内生成完整的音乐作品,或在RTX 3090系统上生成不到10秒的音乐。 xl-turbo变体将处理减少到仅8步(与基本版/ sft版相比约6倍加速)
可适应的作曲长度 – 创建从简短的10秒音符到全面10分钟的安排
扩大的声音调色板 – 使用1000多种不同的音色跨越众多音乐类型的音调特征的细粒度控制
多语言歌词集成 – 使用50多种语言的歌词提示进行结构和风格操作
商业使用授权– MIT 许可框架,利用免版税材料、公共领域资源和 MIDI 数据的合成音频转换
模型选择
所有三个 XL 版本共享相同的 4B 参数框架:
XL-Base– 创意探索的首选之选
下载工作流程
XL-SFT – 优化音频细化,适度降低多样性
下载工作流程
XL-Turbo – 为加速迭代流程进行优化的8步处理
下载工作流程
实现过程
获取更新的ComfyUI版本
访问模板仓库并使用“ACE步骤”术语进行搜索
选择对应的工作流程结构
按照嵌入的指南获取必要的模型
修改提示并执行生成序列
享受您的创意探索过程!