Thomas Dietterich——奧勒岡州立大學名譽教授,在 arXiv 編輯顧問委員會和審核團隊任職——在 X 和 Bluesky 上發帖描述了一項新的執行政策:被發現含有不當 AI 生成內容的稿件將導致每位列名作者獲得一年投稿禁令,加上永久要求任何未來稿件在 arXiv 託管之前在期刊通過正式同儕審查。Dietterich 命名的類別是具體的:「不當語言、剽竊內容、有偏內容、錯誤、失誤、不正確的引用,或誤導性內容」。在此框架下,稿件的所有作者對其內容負責——AI 不是辯護,按下 submit 的作者是。在頂部誠實的警告:這是審核員描述的,尚未由 arXiv 領導層確認。Ars Technica 聯絡確認,在寫作時尚未收到回覆。
這比常規政策更新落地更重的原因是 arXiv 在物理學、天文學和機器學習研究中扮演的角色。在這些領域,預印本是正常發布過程的一部分——研究人員在 arXiv 上發布,在數週或數月內收集非正式同儕回饋,然後迭代到正式期刊提交。一年投稿禁令完全消除了被禁作者的該機制;永久的同儕審查優先要求即使在禁令解除後也消除了預印本文化的速度和回饋形態。換句話說,嚴厲的制裁,根據平台提供的價值進行校準。該政策的依據是 arXiv 現有的審核標準:「向 arXiv 的投稿必須在形式上符合適當的學術交流標準……需要總體的細心和準備的關懷」。Dietterich 的框架是新的執行是審核標準的一致應用,而不是新的內容規則。
值得標記兩個失敗模式。第一:系統可以透過在缺陷 AI 生成稿件上列出無辜作者來操縱,使他們作為附帶損害被禁。arXiv 的審核系統包括申訴流程,但負擔落在被針對的作者身上以自我辯護,一年禁令期間申訴的緩慢節奏正是操縱者想要施加的成本。第二:「不當 AI 生成內容」和「使用 AI 協助起草並正確編輯的稿件」之間的界線不明顯,在該線上的一致執行是長尾問題。Dietterich 的措辭——「不當 AI 產生的內容」——隱含地接受經過作者仔細編輯和驗證的 AI 協助起草。該政策針對的是 slop,而不是工具類別。
對於在 arXiv 上發布 AI/ML 研究的建構者:實際姿態在表面層面沒有改變——生成、編輯、驗證、引用、提交——但失敗成本剛剛增加了一個數量級。正確的紀律是將任何 AI 協助的散文,尤其是引用和參考列表,預設視為可疑,並在提交前驗證。arXiv 社群兩年來一直對 AI 生成的論文通過同儕審查感到沮喪;這項政策是從系統內部開始的第一個具體執行牙齒。arXiv 的機構方面在未來幾天是否批准審核員描述的框架是要關注的事——如果領導層確認,這成為新的底線;如果領導層軟化,它就成為審核員-酌情事件。無論如何,今天給作者的訊號很清楚。
