稳定的音频3.0第0天支持在舒适的用户界面:从音效到更长,更有音乐性的音轨

CN
2026-05-22 02:04:01

我们很高兴宣布Stable Audio 3.0——Stability AI的新一代音乐模型,为艺术实验而打造——即将登陆ComfyUI。这些模型是在完全授权的数据上训练的,带来了可变长度生成、设备友好的小型检查点和

显存
低显存(≤8GB)
阅读时间
3 分钟
下载工作流 JSON

工作流概览

我们很高兴宣布Stable Audio 3.0——Stability AI的新一代音乐模型,为艺术实验而打造——即将登陆ComfyUI。这些模型是在完全授权的数据上训练的,带来了可变长度生成、设备友好的小型检查点和

内容类型: Workflow

主要用途: Download

配置说明

  • 打开工作流模板前,请先安装所需模型。
  • 推荐硬件:低显存(≤8GB)。
  • 使用上方下载按钮将工作流 JSON 导入 ComfyUI。

引入稳定音频3.0集成

我们很高兴宣布稳定音频3.0 - Stability AI创新音乐生成工具包,专为创意探索而设计 - 现已在ComfyUI中提供。这些模型利用合法来源的训练数据并提供灵活的音频持续时间, 轻量级设备兼容 版本和 增强的结构完整性 更长的作品。无缝地在您的既定工作流程中切换于简短的声音效果和延长的音乐作品。

下载工作流模板

关键功能

  • 商业授权 - 使用完全授权的音乐数据集开发

  • 可调节长度 - 可创建从快速效果 (~2 分钟使用 Small) 到延长曲目 (~6 分钟使用 Medium)

  • 高效轻量级模型 - 运行 小型音效小型音乐采用标准处理器而无需专用图形硬件的版本

  • 增强的音乐性-中等版本在图形加速可用时产生更丰富的结构更强大的作品

模型变体

  • 小型-SFX: 声景和简短的环境音段 (≤2:00)

  • 小型-音乐简洁的音乐片段和便携的循环(≤2:00)

  • 中等扩展的结构完整性组成(〜6:20)

小尺寸可以延伸到两分钟(比之前的11秒/47秒限制长得多),而中等尺寸可以超越六分钟的延长序列。

样本创作

音乐作品

完整作品的概念草图,包括风格,乐器,氛围和时长。

低保真hip-hop放松曲目,伴随着柔和的电钢琴,柔和的唱片嘶嘶声,微妙的合成器音色,低通滤波器鼓点,打击乐器伴奏和柔和的拨弦低音,为梦幻般的氛围而创作。BPM:75。时长:150秒

80年代复古合成波流派的音乐,伴有琶音合成器主音,模拟合成器音色,电贝斯,强劲的电子鼓,门控混响鼓点和氛围音效,带来怀旧和生机勃勃的能量。BPM:110。时长:180秒

乐器

适合制作和配乐的个人或小组录音。

吉他闷弦节拍声,节奏紧凑。BPM:100。时长:8秒

拨弦序列循环,音色明亮而共鸣。BPM:128。时长:10秒

环境声音

用于视觉媒体和游戏的纹理、冲击和运动效果。

在砂砾上行走的脚步声,稳定的步行速度,近距离拍摄。长度:8秒

汽车高速驶过,多普勒效应,真实的呼啸声。长度:3秒

隔离的声音

适用于打击乐、界面和采样库的简短个别效果。

爵士音色的低音拨弦,共鸣的木质身体。长度:3秒

拉丁鼓,动态拉丁鼓和打击乐器合奏,采用真实的节奏模式。长度:3秒

实施指南

  1. 更新ComfyUI升级到 0.22.0+ 或通过 访问舒适云

  2. 导航:侧边栏 → 模板 → 音频 → 选择 Stable Audio 3.0 模板

  3. 本地用户:请遵循工作流程指示正确下载和定位模型

  4. 请输入要翻译的文本,指定持续时间(秒),然后执行

中等基础工作流程
完整中等工作流程

祝你创作愉快!

常见问题