檢索：定義與含義 — AI 維基

從大型集合中找到相關文件、段落或資料以回應查詢的過程。在 AI 中，檢索是 RAG 中的「R」——在將上下文提供給語言模型之前獲取相關資訊的步驟。檢索可以使用關鍵字匹配（BM25）、語意相似度（嵌入）或結合兩者的混合方法。

為什麼重要

檢索是使 LLM 在現實世界應用中變得實用的關鍵。模型的內部知識是靜態的、不完整的，有時是錯誤的。檢索在推理時讓它存取當前、準確、領域特定的資訊。你的檢索管線品質直接決定了你的 RAG 系統品質——最好的 LLM 也無法從糟糕的上下文中產生好的答案。

深度解析

傳統檢索（BM25、TF-IDF）將查詢關鍵字與文件關鍵字進行匹配，根據頻率和重要性加權。它快速、可解釋，且擅長精確匹配。語意檢索將查詢和文件編碼為嵌入，並在向量空間中找到最近鄰。它處理釋義和概念相似性，但可能遺漏精確的關鍵字匹配。混合檢索結合兩者，通常使用倒數排名融合來合併結果。

分塊策略

對於 RAG，文件必須在嵌入之前被分割成塊。塊大小是一個關鍵的設計決策：太小會失去上下文，太大會用雜訊稀釋相關資訊。常見策略包括固定大小的塊加重疊、句子級分割、段落級分割，以及尊重文件結構（標題、章節）的遞迴分割。最佳方法取決於你的文件和查詢。

重新排名

一個常見的模式：使用快速檢索檢索一組廣泛的候選項（例如 50 個），然後使用更準確（但更慢）的模型對其重新排名。交叉編碼器重排器（如 Cohere Rerank 或 BGE-Reranker）一起處理查詢-文件配對，產生比嵌入相似度更準確的相關性分數。這個兩階段管線平衡了速度（快速初始檢索）和準確性（對頂級候選項的精確重新排名）。

檢索

為什麼重要

深度解析

分塊策略

重新排名

相關概念