Music Generation（音樂生成）：定義與含義 — AI 維基

使用 AI 模型從文字描述、旋律或其他音訊輸入建立音樂。「一首節奏輕快的電子曲，帶有朗朗上口的合成器旋律，120 BPM」可產出完整的音樂作品。Suno、Udio、MusicLM（Google）和 Stable Audio 是領先的模型。目前的系統可以生成多種風格和流派的人聲、伴奏和完整編曲。

為什麼重要

音樂生成是影像生成的音訊版——它使音樂創作變得人人可及，而不僅限於受過訓練的音樂家。內容創作者需要背景音樂，遊戲開發者需要配樂，廣告商需要旋律。AI 音樂以遠低於僱用音樂家的成本和時間滿足這些需求。但它也引發了與影像生成相同的版權和真實性問題。

深度解析

音樂生成模型使用兩種主要方法：音訊原生模型（使用類似擴散模型或自迴歸 Transformer 的架構生成原始音訊波形）和基於 MIDI 的模型（生成符號音樂記譜，然後用合成器渲染）。音訊原生模型（Suno、MusicGen）產生更逼真的結果，但計算成本高。MIDI 方法更可控但聽起來不那麼自然。

版權雷區

音樂 AI 引發了激烈的版權問題。在受版權保護的音樂上訓練的模型可能會再現可辨識的元素——一段旋律、一種聲音風格、一種製作技巧。一些平台已被唱片公司起訴。法律狀態仍在演變：生成「某位藝術家風格的」音樂可能合法（風格不受版權保護），但生成聽起來像特定歌曲的東西則不行。大多數商業音樂 AI 服務實施過濾器以防止生成與已知受版權保護的作品過於相似的內容。

創意應用

除了取代音樂家之外，AI 音樂還啟用了新的創意工作流程：生成製作人隨後精修的示範曲目、建立根據遊戲玩法變化的自適應遊戲配樂、製作個性化音樂（帶有你孩子名字的搖籃曲），以及讓有想法但沒有演奏技能的人也能進行音樂製作。最有趣的應用是將 AI 視為創意合作者而非替代品。

Music Generation

為什麼重要

深度解析

版權雷區

創意應用

相關概念