Suno证明了AI可以通过纯文本提示生成完整且可聆听的歌曲,一夜之间创造了一种全新的创意工具类别。他们正处于生成式AI领域最具影响力的版权之争的核心,RIAA诉讼的结果很可能为所有模态中训练数据权利的运作方式设定先例。更广泛地说,他们代表了最严峻的考验,即民主化创意工具究竟是扩展了人类表达,还是削弱了支撑专业艺术家的经济基础。
Suno 于 2023 年由 Mikey Shulman、Georg Kucsko、Martin Camacho 和 Keenan Freyberg 创立——这支团队来自 Kensho Technologies,这是一家人工智能分析公司,于 2018 年被 S&P Global 以 5.5 亿美元收购。创始人多年来一直致力于音频和机器学习问题的研究,他们发现了一个机会:大型语言模型使文本生成变得极其简单,图像生成随着 Stable Diffusion 和 Midjourney 的出现而迅速发展,但音乐领域仍处于空白。他们在 2023 年底首次公开发布的版本,可以通过文本提示生成可接受的歌曲——歌词、人声、乐器、编曲和制作——一次性完成。到 2024 年初,他们以 5 亿美元估值完成了 1.25 亿美元的 B 轮融资,由 Lightspeed Venture Partners 领投,Nat Friedman、Daniel Gross 和 Matrix Partners 参与投资。
Suno 采用从根本上端到端的方法进行音乐生成。与早期尝试分别使用模型处理旋律、和声、节奏和人声不同,Suno 在完整歌曲上进行训练并生成完整歌曲。你只需提供一个描述你想要的文本提示——流派、情绪、歌词、风格——它就会生成一首完整的曲目,通常为 2-4 分钟,结构包括主歌、副歌和桥段。2024 年初发布的 v3 模型是第一个能够定期生成人们愿意反复聆听的歌曲的版本。到 v4 版本时,质量已提升到非专业听众经常无法区分 Suno 生成的曲目和人类创作的独立音乐。该模型支持数十种流派,从嘻哈到古典,并支持自定义歌词或生成自己的歌词。
任何 AI 音乐公司都无法回避版权问题,Suno 直接撞上了这个问题。2024 年 6 月,RIAA 对 Suno(及其竞争对手 Udio)提起了一起重大版权侵权诉讼,指控这些公司未经许可使用受版权保护的录音来训练其模型。Suno 承认在训练中使用了受版权保护的音乐,但辩称这属于合理使用——一个可能需要数年时间才能完全解决的法律立场。此案成为关于生成式 AI 和知识产权更广泛辩论中的一个里程碑,其影响远超音乐领域。与此同时,Suno 与一些版权持有者签署了授权协议,并继续改进产品,押注技术的势头最终会迫使行业适应,而不是通过诉讼将其淘汰。
Suno 的主张是,音乐创作应该像发送一条短信一样容易。在生成式 AI 出现之前,制作一首精良的歌曲需要多年的音乐训练、昂贵的设备、录音室时间和通常需要专业团队。Suno 将所有这些简化为一个文本框和 30 秒的等待时间。对于数以百万计脑海中拥有歌曲但无法将其表达出来的人来说,这确实具有变革性。然而,职业音乐人的强烈反对意见是,将音乐“免费化”会贬低这门艺术,并威胁到一个本就对大多数艺术家支付不足的行业的生计。双方都有道理,这种紧张关系的解决方式将反映出社会如何更广泛地处理创造性的 AI。
Suno 采用的是免费加付费模式:免费用户每天只能生成少量歌曲,付费订阅用户则可获得更多生成次数、更高品质和商业使用权限。其主要竞争对手是 Udio,后者采取类似方法但具有不同的美学优势。Google 的 MusicLM 和 Meta 的 MusicGen 是尚未积极商业化的研究项目。Suno 大力押注消费者病毒式传播——他们的歌曲设计用于在社交媒体上分享,产品还具有类似 TikTok 的信息流以发现 AI 生成的音乐。截至 2026 年初,他们已有数千万用户,生成了数亿首歌曲,使其成为两年前尚不存在的类别中的明显市场领导者。