Zubnet AI學習Wiki › 對比學習
訓練

對比學習

別名:SimCLR、InfoNCE

一種自監督學習方法,透過對比正對(相似的項目,應在嵌入空間中接近)和負對(不相似的項目,應在嵌入空間中遠離)來訓練模型。CLIP 對比匹配的圖像-文本對和不匹配的對。SimCLR 對比同一圖像的增強視圖和不同圖像的視圖。模型學習到嵌入空間中的相似性反映真實世界的相似性的表示。

為什麼重要

對比學習是大多數嵌入模型的訓練方式 — 這些模型驅動著語意搜尋、RAG 和推薦系統。它也是 CLIP 背後的訓練方法,連接了語言和視覺。每當你使用嵌入來衡量相似性時,對比學習很可能就是這些嵌入的建立方式。

深度解析

InfoNCE 損失(CLIP 和許多嵌入模型使用):給定一批 N 個正對,將批次中的 N−1 個不匹配項目視為負例。損失將正對嵌入推得更近,將負對嵌入推得更遠。關鍵洞見:你不需要明確標記的負例 — 批次中的其他項目免費充當負例,使這種方法具有高度可擴展性。

資料增強作為監督

在視覺中,對比學習透過資料增強建立正對:同一圖像的兩個隨機裁剪是一個正對(它們從不同視角展示相同內容)。不同圖像形成負對。模型學習增強視圖應具有相似的嵌入,而不同圖像應具有不同的嵌入。這在沒有任何標籤的情況下學習了有用的視覺表示 — 純自監督。

困難負例

並非所有負例對學習都同等有用。「困難負例」— 相似但不匹配的項目 — 提供最多的學習訊號。對於關於「Python 網頁框架」的查詢,困難負例可能是關於「Python 資料科學」的文件(相似主題,錯誤答案),而非關於「烹飪食譜」的文件(明顯不相關)。挖掘困難負例是訓練高品質嵌入模型的關鍵技術。

相關概念

← 所有術語
← 專家混合模型 對齊 →