Stable Audio是什么

Stable Audio 是Stability AI推出的首个产品,用于音乐和音效生成。用户可以通过输入文本提示和持续时间来创作原创音频。这个工具基于稳定性AI的潜在扩散模型架构,可以根据文本元数据、音频文件持续时间和起始时间生成音频。产品发布于2023年9月19日。

Stable Audio特点

  • 底层模型利用音乐库AudioSparx的音乐和元数据进行训练,可根据用户提供的描述性文本提示和所需的音频长度生成音轨。
  • 基于最先进的音频扩散人工智能模型开发,通过输入文本提示为用户生成符合要求的音乐作品。
  • 提供高质量的44.1kHz立体声音频,确保音质出色,适合多种用途。
  • 用户可以将通过Stable Audio创建的音乐用于商业用途,具有商业用途授权。
  • Stable Audio模型由几个不同部分组成的潜在扩散模型,包括变分自动编码器、文本编码器和基于U-Net的条件扩散模型。

Stable Audio缺点

无法生成人声演唱。

收费

Stable Audio 提供免费和付费两种版本。免费版本每月可制作20首歌,每首歌最长45秒。付费版本除了可以制作更多乐曲,每首歌最长90秒,且可以把乐曲用于商业用途。截止2024年2月,按照不同的订阅方式,从每月11.99美元到89.99美元不等。