Stable Audio Open:用文字“奏响”音频
近期,备受瞩目的人工智能公司 Stability AI 重磅发布了开源音频模型 Stable Audio Open,为音乐制作和声音设计领域带来了颠覆性的创作体验。用户只需输入简单的文本描述,即可生成时长近 47 秒的高质量音频,涵盖鼓点、乐器 riff、环境氛围、拟音等多种音频素材,为音乐创作和声音设计提供前所未有的便利。
Stable Audio Open:开源、灵活、尊重版权
Stable Audio Open 最引人注目的特点之一便是其开源性质。这意味着用户可以根据自身需求对模型进行微调,例如,鼓手可以利用该模型学习并生成独具个人风格的鼓点。
与 Stability AI 此前推出的商业产品 Stable Audio 相比,Stable Audio Open 更侧重于音频样本、音效和音乐素材的创作,而非完整的音乐作品。Stable Audio 则更擅长生成结构完整的音乐曲目,并拥有音频风格转换、多声部音乐创作等更强大的功能。
更值得一提的是,Stable Audio Open 的训练数据源自 Freesound 和 Free Music Archive 等平台,确保了模型在创作过程中对版权的尊重,为用户免除后顾之忧。
Stable Audio Open:未来音频创作的曙光
Stable Audio Open 的推出,标志着人工智能在音频领域的又一次重大突破。Stability AI 表示,未来将持续深耕音频技术,并与广大音乐人和声音设计师携手合作,共同探索音频创作的无限可能。
想要体验 Stable Audio Open 的强大功能,请访问 Hugging Face 下载模型。
关注 Stability AI 的 Twitter、Instagram、LinkedIn 和 Discord 社区,及时获取最新资讯。