Sullivan & Cromwell 在聯邦破產法庭被抓到提交 ChatGPT 編造的虛假引證

Sullivan & Cromwell，全美最負盛名的律所之一，在曼哈頓聯邦破產法庭提交的一份破產動議中，包含了對不存在案例的引證、對美國破產法典段落的錯誤引用，以及對真實案例的不準確摘要。Martin Glenn 法官收到了律所重組業務聯合主管 Andrew Dietderich 的道歉信。這些錯誤是由對方律師 Boies Schiller Flexner 在例行審閱文件時發現的。消息來源告訴《金融時報》，S&C 擁有 OpenAI ChatGPT 的企業版授權，儘管律所沒有正式確認是哪個模型產出了這些錯誤引證。

這個模式現在已經熟悉到令人沮喪。Morgan & Morgan、Levidow Levidow & Oberman 和一系列較小的律所都已經因為提交 AI 幻覺引證而受到制裁。讓這次值得注意的是律所本身：S&C 不是一個獨立從業者在 Google 找捷徑。這是一家華爾街前五的律所，每小時計費率超過兩千美元，有企業級 AI 部署，有資源建構任何想要的驗證工作流程。幻覺引證還是過去了。失敗模式和此前每次事件都一樣：律師讓模型找支持性案例，模型產出了看起來像支持性案例的東西，律師在沒有獨立核實這些案例確實存在的情況下簽字。

技術現實，給還困惑的人：ChatGPT 沒有經過驗證的法院判決資料庫。它生成的是匹配法律引證通常長什麼樣的文字。當正確的引證存在於訓練資料中，它可以準確重現。當正確的引證不存在或模型不確定時，它依然會產出一個看起來合理的引證，有聽起來真實的案例名、聽起來真實的判例彙編卷號、聽起來真實的頁碼。沒有內部旗標說「我編的」。模型不知道自己不知道。企業版授權不改變這點；它改變的是計費和資料保留，不是語言模型在被要求檢索事實時編造的根本傾向。

解決辦法是營運層面的，不是技術層面的。任何使用 AI 做法律研究的律所都需要一條硬規則：每條引證在摘要簽字前都必須獨立對照 Westlaw、LexisNexis 或 PACER 驗證，驗證步驟必須可稽核。把檢索錨定到真實案例資料庫的工具——現在有好幾家瞄準這個市場——讓工作流更便宜，但不能免除律師核實的義務。S&C 的教訓不是 ChatGPT 在法律上獨特地差；是即便是有企業級 tooling 的成熟組織，如果工作流不強迫他們，也會跳過驗證。法官的耐心快用完了。律師公會轉介和金錢制裁來得更頻繁。能熬過這個轉型的律所，是那些把模型輸出當作待核對草稿、而不是當作待簽署成品的律所。

Sullivan & Cromwell 在聯邦破產法庭被抓到提交 ChatGPT 編造的虛假引證

更多新聞