Malus.sh 是這樣一個服務:拿一個開源函式庫,做一次 AI 輔助的「淨室」重寫,然後用買家想要的任何授權發布——通常是 MIT 或 BSD,刻意剝離原專案的 copyleft 或歸屬要求。這個工具自己網站上的推銷話術毫不掩飾:「法律上獨立的程式碼,企業友善的授權。無歸屬。無 copyleft。無麻煩。」共同創辦人 Mike Nolan,一位曾研究開源政治經濟學的聯合國研究員,營運著背後的有限責任公司。最早引起開發者關注的具體案例:chardet,那個廣泛使用的 Python 字元編碼偵測函式庫,上個月被用 Anthropic 的 Claude Code 重寫,並以一個跟原專案歷史毫無關係的 MIT 授權重新發布。
這個法律理論真的很老,也真的很牢靠。淨室逆向工程是產生了 IBM 相容 PC 產業的那個原則:一個團隊規定軟體做什麼,另一個獨立團隊從那些規範出發寫新程式碼,從來不看原始程式碼,由此產生的程式碼因為沒有發生複製而不侵犯原始程式碼的版權。Phoenix Technologies 在 80 年代搭了一個淨室 BIOS 並經受住了法律挑戰。Compaq 做了同樣的事。這個原則堅持了四十年。2026 年改變的是成本:以前一次重寫需要一支中國牆團隊加幾個月的嚴謹流程,現在一個工程師可以用幾天做完,讓一個 LLM 幹重活。開發者 Dan Blanchard 在評論 chardet 事件時說得很直白:「我不覺得這個時候還能把精靈塞回瓶子裡。」
法律理論裡沒說出口的漏洞是:AI 輔助的重寫是否真的算淨室。經典原則假設重寫團隊對原程式碼零接觸。Claude Code、GPT-5 和市場上每一個其他程式碼模型都是在大量公共原始碼上訓練的,包括 chardet,包括 Malus.sh 大概最有用的那些 GPL 函式庫。當你叫這種模型「按這些規範重寫這個函式庫」,模型可能沒把原檔案打開,但它在訓練時讀過,並且可能重現結構、註解,甚至逐字片段。還沒有法庭測試過這是否構成衍生作品,目前正在系統裡走的 AI 訓練案件大多關於輸出的相似度,而不是介於中間的那個問題:訓練得來的知識是否算作存取。Malus.sh 招來的第一起訴訟,會成為這個問題的測試案例。
對開發者來說,實際的解讀是:這件事比 chardet 大,比版權大。開源的隱含協議——你拿我的程式碼,你尊重我的授權——是把整個生態拼在一起的唯一東西,它依賴一種現在已經很便宜就能繞過的社會規範。授權剝離一直是可能的;只是需要的工作量足以讓大多數公司選擇遵守或付費。AI 把那個工作量壓縮了一個數量級。維護者可用的防守招數有限:和商業條款雙重授權、對專案名註冊商標(你可以複製程式碼,但不能叫它 chardet),以及給專案基金會起訴資格的貢獻者協議。這些都不能幫已經使用寬鬆授權的函式庫。誠實的答案是:在塵埃落定之前,生態需要新規範、新的來源追蹤 tooling,可能還需要新一波法庭裁決。在此期間,精靈確實出來了,唯一的問題是規則追趕上來時會是什麼形態。
