Sullivan & Cromwell,全美最負盛名的律所之一,在曼哈頓聯邦破產法庭提交的一份破產動議中,包含了對不存在案例的引證、對美國破產法典段落的錯誤引用,以及對真實案例的不準確摘要。Martin Glenn 法官收到了律所重組業務聯合主管 Andrew Dietderich 的道歉信。這些錯誤是由對方律師 Boies Schiller Flexner 在例行審閱文件時發現的。消息來源告訴《金融時報》,S&C 擁有 OpenAI ChatGPT 的企業版授權,儘管律所沒有正式確認是哪個模型產出了這些錯誤引證。
這個模式現在已經熟悉到令人沮喪。Morgan & Morgan、Levidow Levidow & Oberman 和一系列較小的律所都已經因為提交 AI 幻覺引證而受到制裁。讓這次值得注意的是律所本身:S&C 不是一個獨立從業者在 Google 找捷徑。這是一家華爾街前五的律所,每小時計費率超過兩千美元,有企業級 AI 部署,有資源建構任何想要的驗證工作流程。幻覺引證還是過去了。失敗模式和此前每次事件都一樣:律師讓模型找支持性案例,模型產出了看起來像支持性案例的東西,律師在沒有獨立核實這些案例確實存在的情況下簽字。
技術現實,給還困惑的人:ChatGPT 沒有經過驗證的法院判決資料庫。它生成的是匹配法律引證通常長什麼樣的文字。當正確的引證存在於訓練資料中,它可以準確重現。當正確的引證不存在或模型不確定時,它依然會產出一個看起來合理的引證,有聽起來真實的案例名、聽起來真實的判例彙編卷號、聽起來真實的頁碼。沒有內部旗標說「我編的」。模型不知道自己不知道。企業版授權不改變這點;它改變的是計費和資料保留,不是語言模型在被要求檢索事實時編造的根本傾向。
解決辦法是營運層面的,不是技術層面的。任何使用 AI 做法律研究的律所都需要一條硬規則:每條引證在摘要簽字前都必須獨立對照 Westlaw、LexisNexis 或 PACER 驗證,驗證步驟必須可稽核。把檢索錨定到真實案例資料庫的工具——現在有好幾家瞄準這個市場——讓工作流更便宜,但不能免除律師核實的義務。S&C 的教訓不是 ChatGPT 在法律上獨特地差;是即便是有企業級 tooling 的成熟組織,如果工作流不強迫他們,也會跳過驗證。法官的耐心快用完了。律師公會轉介和金錢制裁來得更頻繁。能熬過這個轉型的律所,是那些把模型輸出當作待核對草稿、而不是當作待簽署成品的律所。
