讓任何人都能透過文字提示創作完整的歌曲——人聲、樂器、製作——的AI音樂生成公司。數個月內從無人知曉成長至數百萬用戶,迫使音樂產業正面應對AI創造力的挑戰。
Suno 於 2023 年由邁克·舒爾曼(Mikey Shulman)、喬治·庫斯科(Georg Kucsko)、馬丁·卡馬喬(Martin Camacho)與凱南·弗里伯格(Keenan Freyberg)共同創立,這支團隊來自於肯斯霍科技(Kensho Technologies),而肯斯霍科技在 2018 年以 5.5 億美元的價格被標準普爾全球(S&P Global)收購。創始人曾多年投入音訊與機器學習問題的研究,他們發現一個機會:大型語言模型(LLM)已讓文字生成變得極為簡單,圖像生成更因 Stable Diffusion 與 Midjourney 的出現而蓬勃發展,但音樂領域卻仍處於未開發狀態。他們在 2023 年底首次公開釋出的版本,能從文字提示(prompt)中一次生成完整的歌曲,包括歌詞、人聲、樂器、編曲與製作。到了 2024 年初,他們以 5 億美元估值完成 1.25 億美元的 B 輪融資,由 Lightspeed Venture Partners 領投,Nat Friedman、Daniel Gross 與 Matrix Partners 等也參與投資。
Suno 採取端對端(end-to-end)的音樂生成方式。與早期將旋律、和聲、節奏與人聲分開處理的嘗試不同,Suno 是以完整歌曲為訓練資料,並直接生成完整歌曲。你只需提供一段文字提示,描述你想要的風格、情緒、歌詞與形式,Suno 就會產生一首長度約 2 至 4 分鐘的完整曲目,包含結構完整的段落、副歌與橋段。2024 年初推出的 v3 版本,是首款能穩定產生讓人願意反覆聆聽的歌曲的版本。到了 v4 版本,品質已提升到讓一般聆聽者難以分辨 Suno 生成的曲目與人類創作的獨立音樂之間的差異。該模型支援數十種音樂類型,從嘻哈到古典皆可處理,並支援自訂歌詞或自動生成歌詞。
任何 AI 音樂公司都無法迴避版權問題,而 Suno 直接撞上這道牆。2024 年 6 月,美國唱片業協會(RIAA)對 Suno(以及競爭對手 Udio)提起重大版權侵權訴訟,指控兩家公司未經許可即使用受版權保護的錄音資料訓練模型。Suno 承認在訓練中使用了受版權保護的音樂,但辯稱這屬於「合理使用」(fair use)——一個可能需要數年時間才能釐清的法律立場。此案成為生成式 AI 與知識財產權爭議的標誌性時刻,其影響遠超出音樂產業範疇。同時,Suno 也與部分版權持有者簽訂授權協議,並持續改進產品,押注技術的動能最終將迫使產業適應,而非透過訴訟將其淘汰。
Suno 的主張是:音樂創作應像發送簡訊一樣容易。在生成式 AI 出現前,要創作一首精緻的歌曲需要多年音樂訓練、昂貴設備、錄音室時間,以及通常還需要專業團隊。Suno 將所有這些流程壓縮成一個文字框與 30 秒的等待時間。對數百萬腦中已有旋律卻無從表達的人來說,這確實是革命性的改變。然而,許多職業音樂人的反對聲音也很強烈,他們認為將音樂「免費化」會貶低這門技藝,並威脅到一個本身已對大多數藝術家報酬過低的產業。雙方都有道理,而這場張力最終如何解決,將反映出社會整體對創造性 AI 的態度。
Suno 採用免費加付費(freemium)模式:免費用戶每天可生成少量歌曲,付費訂閱者則可獲得更多生成次數、更高品質與商業使用權。其主要競爭對手是 Udio,兩者採取類似策略,但 Udio 在審美風格上有不同優勢。Google 的 MusicLM 與 Meta 的 MusicGen 是尚未積極商業化的研究專案。Suno 則大力推動消費者病毒式傳播,其歌曲設計為可在社群媒體分享,產品也具備類似 TikTok 的資訊流,用以發現 AI 生成的音樂。截至 2026 年初,Suno 已擁有數千萬用戶,生成歌曲數達數億首,使其成為一個兩年前還不存在的領域中的明顯市場領導者。