Zubnet AI學習Wiki › 模型卡
安全

模型卡

別名:模型文件、資料表

一份標準化文件,描述機器學習模型的預期用途、效能特性、訓練資料、限制和倫理考量。由 Mitchell 等人(2019 年)提出,模型卡旨在提高透明度,幫助使用者做出關於模型是否適合其使用案例的明智決定。

為什麼重要

模型卡是 AI 的營養標籤。沒有它們,你就是在盲目地使用模型 — 你不知道它是在什麼資料上訓練的、它在什麼方面表現好和不好,或者它可能對哪些群體造成不利。隨著 AI 法規的增加(EU AI Act 要求文件),模型卡正從最佳實踐轉變為法律要求。

深度解析

模型卡通常包括:模型詳情(架構、版本、日期)、預期用途(模型設計用於什麼以及不應該用於什麼)、訓練資料(訓練資料集的描述,包括任何已知偏差)、效能指標(按相關子群體細分)、限制(已知的失敗模式、邊界情況),以及倫理考量(潛在危害、緩解策略)。

實踐中

Hugging Face 通過要求其 Hub 上所有模型都提供模型卡而使之普及。品質差異很大 — 有些是詳細的技術文件,有些則是敷衍的佔位符。最好的模型卡包含按群體的效能細分(模型對不同語言、人口統計或領域的表現是否相同?)、具體的失敗案例,以及對限制的誠實評估而非行銷語言。

資料卡和系統卡

概念延伸到模型之外:資料卡記錄資料集(收集方法、標註流程、已知偏差),系統卡記錄整個 AI 系統(模型 + 後處理 + 護欄 + 部署情境)。Anthropic 為 Claude 的發布發布系統卡。這些更廣泛的文件捕捉了模型卡單獨無法涵蓋的資訊 — 一個模型可能在隔離狀態下是安全的,但在具有某些工具使用能力或沒有內容過濾器的情況下部署時則是危險的。

相關概念

← 所有術語
← 模型 模型合併 →
ESC