研究人員開發了 Proxy-Pointer RAG,這是一種混合架構,試圖將 PageIndex 等「無向量」檢索系統的準確性與傳統向量資料庫的速度和成本效益相結合。該方法源於 PageIndex 在金融基準測試中 98.7% 的準確率,它依賴於構建分層「Smart Table of Contents」結構,讓 LLM 像人類專家一樣導航文件,而不是搜尋隨機片段。
PageIndex 和類似無向量方法的核心問題是殘酷的經濟現實:構建分層樹索引需要在攝取期間進行昂貴的 LLM 呼叫,檢索需要兩次 LLM 操作——一次導航樹結構,另一次進行綜合。向量 RAG 儘管存在準確性限制,但在操作現實中獲勝:攝取使用便宜的 embedding 模型,檢索只需單次 LLM 呼叫,以及跨文件集合的簡單擴展。PageIndex 在複雜文件深度分析方面表現出色,但在需要企業級知識庫時就會失效。
Proxy-Pointer RAG 聲稱透過將 PageIndex 的結構化推理原理融入向量索引架構來解決這個問題,儘管在現有報導中技術細節仍然稀少。該方法在一份 131 頁的世界銀行報告上使用 Gemini-3-Flash 進行了示範,但沒有獨立驗證或更廣泛的比較研究,目前尚不清楚這是否代表真正的突破或僅僅是增量工程改進。
對於構建生產 RAG 系統的開發者來說,核心矛盾依然存在:準確性與操作約束。在我們看到詳細基準測試、成本分析和實際部署資料之前,Proxy-Pointer RAG 只是加入了在研究論文中聽起來很有前景但可能無法在生產工作負載和預算現實面前存活的 RAG 優化技術的長列表。
