騰訊 4 層 agent 記憶體:SWE-bench 58.4 → 64.2%,SQLite 本地,MIT

騰訊本週在 MIT 下放出了一個認真的 agent 記憶體版本——TencentDB Agent Memory,一個 4 層金字塔,解決了大多數 agent 團隊還在手工繞開的長時上下文膨脹問題。形狀:底部 L0 原始對話日誌,L1 JSONL 原子事實,L2 Markdown 場景區塊,L3 頂部 Markdown 使用者人設。上層保留結構,下層保留證據,每次 retrieval 都帶 `node_id` + `result_ref`,這樣當人設層級事實不夠時,agent 可以確定性下鑽。對那些 ship 跑多 turn 的 agent 的人來說,這是迄今為止公開的最乾淨的記憶體問題架構。

在連續長時會話(不是單 turn 查找,後者才是正確 benchmark)上的數字:啟用外掛後 SWE-bench 58.4% → 64.2%(相對 +9.9%),token 使用降 33%。WideSearch 33% → 50%(+51.5%),token 降 61%。AA-LCR 44.0% → 47.5%,token 降 31%。PersonaMem 48% → 76%(+59%)。預設:帶 sqlite-vec 擴充的 SQLite,零外部 API 相依,Markdown 檔案在 `~/.openclaw/memory-tdai/`。Recall 有 5 秒逾時,逾時時系統跳過注入而不是阻塞——所以慢的 retrieval 無法卡住 agent loop。BM25 + 向量混合,透過 Reciprocal Rank Fusion,預設 top-5。L1 原子事實擷取每 5 turn 一次;每 50 個新記憶重新生成人設。

生態解讀:Mem0、Letta、MemGPT 和 Zep 已經分割 agent 記憶體兩年了,但 4 層分解是架構差異。大多數現有系統要麼把一切扁平化到向量索引(Mem0、Zep),要麼維護 hot/cold 拆分(MemGPT)。金字塔方法給你 Persona-as-Markdown(使用者可稽核、人類可讀、易編輯)、Atomic-as-JSONL(結構化、可解析、下鑽鍵)和底層原始日誌。這是一個可以用 `grep` 除錯的白盒記憶體系統。騰訊把對 Mem0/Letta/MemGPT/Zep 的正面 benchmark 留在了發布之外——給個星號——但 SWE-bench 差值配 33% token 削減,是那種能經得起復現的數字。Repo:github.com/Tencent/TencentDB-Agent-Memory。

週一早上:整合目前鎖死在騰訊的 OpenClaw(單 npm 套件 `@tencentdb-agent-memory/memory-tencentdb`,需要 Node.js 22.16+)或 Hermes Agent(只支援 Docker)。v1 中沒有 LangChain 或 LlamaIndex 綁定——如果你想在現有 harness 下使用 4 層架構,這就是明顯的社群缺口。如果你的 agent 每個 turn 都在重播對話歷史燒 token,而你在等一個公開 baseline 後再建構自己的記憶體系統,clone repo,讀 L0→L3 schema,決定是包裝它還是用你的 stack 重新實作這個架構。benchmark 數字是可信的;整合成本是 trade-off。

騰訊 4 層 agent 記憶體:SWE-bench 58.4 → 64.2%,SQLite 本地,MIT

更多新聞