音樂生成模型使用兩種主要方法:音訊原生模型(使用類似擴散模型或自迴歸 Transformer 的架構生成原始音訊波形)和基於 MIDI 的模型(生成符號音樂記譜,然後用合成器渲染)。音訊原生模型(Suno、MusicGen)產生更逼真的結果,但計算成本高。MIDI 方法更可控但聽起來不那麼自然。
音樂 AI 引發了激烈的版權問題。在受版權保護的音樂上訓練的模型可能會再現可辨識的元素——一段旋律、一種聲音風格、一種製作技巧。一些平台已被唱片公司起訴。法律狀態仍在演變:生成「某位藝術家風格的」音樂可能合法(風格不受版權保護),但生成聽起來像特定歌曲的東西則不行。大多數商業音樂 AI 服務實施過濾器以防止生成與已知受版權保護的作品過於相似的內容。
除了取代音樂家之外,AI 音樂還啟用了新的創意工作流程:生成製作人隨後精修的示範曲目、建立根據遊戲玩法變化的自適應遊戲配樂、製作個性化音樂(帶有你孩子名字的搖籃曲),以及讓有想法但沒有演奏技能的人也能進行音樂製作。最有趣的應用是將 AI 視為創意合作者而非替代品。