「slop」這個詞在2024年初進入了AI詞彙表,並迅速被接受,因為它完美地描述了現象。開發者兼部落客Simon Willison是推動這個詞流行的主要人物,他將「slop」與電子郵件垃圾郵件(spam)直接聯繫起來:正如「spam」從蒙提·派森喜劇小品演變成代表「不想要的電子郵件」的通用詞語,「slop」則命名了人們早已經歷卻缺乏適當詞語描述的現象——低品質、AI生成內容的浪潮淹沒了網際網路的每一個平台。這個比喻不僅僅是命名上的類比。垃圾郵件(spam)之所以摧毀電子郵件,不是因為單一垃圾郵件本身有多危險,而是因為發送成本降至零,而過濾成本卻始終居高不下。「slop」的運作方式也一樣。當生成一篇2,000字的文章只需零點幾分錢,且僅需十二秒鐘,內容創作的經濟模式就徹底崩解了。這個詞之所以流行,是因為人們早已憤怒——他們只是需要一個足夠銳利的詞語來匹配這種感受。
追蹤資金流向,就能畫出「slop」生態系的輪廓。SEO內容農場是最早且最積極採用「slop」的機構——原本支付自由撰稿人每篇文章15美元的公司,發現他們幾乎可以零成本每天生成數千篇文章,並用塞滿關鍵字的網頁對Google進行地毯式轟炸。亞馬遜的Kindle Direct Publishing平台被AI生成的書籍淹沒,有些書甚至歸於與其毫無關聯的真實作者名下,有些則以「由ChatGPT撰寫」為賣點販售。Etsy曾是手作商品的天堂,如今卻充斥著AI生成的藝術印刷品和以2.99美元販售的「數位下載」,這些作品僅是Midjourney的輸出結果。LinkedIn則淪為互動誘餌的荒原——那些令人厭惡的開頭為「我剛解雇了我的最佳員工。這是我做過最好的決定」的帖子,實際上是由從未解雇過任何人、甚至可能連員工都沒有的人所撰寫。還有那些假新聞網站:整份刊物皆由AI生成的文章、AI生成的作者名稱與AI生成的作者照片組成,專門製造看似可信的報導以純粹追求廣告收益。這些參與者對自己在做什麼毫無混淆。他們知道這就是「slop」。他們只是不在乎,因為即使內容不真實,金錢卻是真實的。
這就是「slop」成為存在性問題,而非僅僅是煩惱之處的時刻。AI模型是透過網際網路資料訓練而成,而網際網路如今充斥著AI生成的內容。那麼,當下一代模型訓練資料來自前一代模型的輸出時,會發生什麼事?研究人員稱之為「模型崩解」——一種遞歸退化現象,每一代以AI訓練出的AI都會逐漸失去精準度、多樣性與準確性,就像複製一份複製件會變得越來越模糊。牛津大學2023年的一篇論文實證了這一點:語言模型若以自身輸出作為訓練資料,會逐漸失去表達分布尾端的能力,風格也變得越來越狹窄與普通。實際影響是,2023年之前網際網路——也就是生成式AI尚未淹沒所有平台的網際網路——如今作為訓練資料變得極其寶貴,因為它是由人類撰寫的。企業現在願意支付高價購買前AI時代的資料集,並與出版商達成「認證人類撰寫」內容的協議。諷刺的是,那些本應讓內容更加豐富的工具,反而讓真實內容變得稀缺。
平台的回應混合了真誠的努力與形式上的擔憂。Google在2023至2024年間推出的「有幫助內容更新」(Helpful Content Update)明確針對那些只為了在搜尋結果中排名而存在的AI生成內容。這項更新導致一些最差的內容農場流量暴跌,但這場軍備競賽仍在持續——「slop」生成器的適應速度比演算法追趕的速度更快。Reddit採取了更強硬的立場,許多主要子版塊直接禁止AI生成內容,而該網站在Google搜尋結果中增加的能見度(感謝Google與Reddit之間的協議)則成為「可能是人類撰寫」的代理信號。Stack Overflow在2022年12月禁止AI生成的答案,因為管理員發現大量看似自信卻隱含錯誤的回應湧入——這正是大型語言模型(LLMs)擅長產生的合理無聊內容。在監管層面,歐盟AI法案與各國的相關措施推動了AI生成內容的水印與揭露要求,但執法仍停留在理論階段。在這場戰鬥中勝出的平台,是那些驗證人類而非試圖偵測機器的平台——因為在模型每月都變得更擅長模仿人類寫作的背景下,偵測本身就是一場注定失敗的戰爭。
坦白說,「slop」實際上並非生成式AI的失敗。它是生成式AI按照設計精準運作的結果,而在那些與你利益不一致的人手中。讓獨自開發者為其開放源碼專案撰寫文件的同一工具,也能讓內容工廠在一夜之間生成一萬篇垃圾文章。協助獨立遊戲設計師原型化概念藝術的同一張圖片生成器,也能讓按需印刷的騙子向Amazon灌輸AI生成的填色書。你無法創造出讓創作變得輕鬆的技術,卻在輕鬆創作大多是垃圾時感到驚訝——這就是「輕鬆」的含義。真正的問題,是目前尚無