Mémoire agent 4-tiers de Tencent : SWE-bench 58,4 à 64,2%, SQLite local, MIT

Tencent a sorti une release sérieuse sur la mémoire d'agent sous MIT cette semaine — TencentDB Agent Memory, une pyramide 4-tiers qui règle le problème de context-bloat long-horizon que la plupart des shops d'agent contournent encore à la main. La forme : L0 logs de conversation brute en bas, L1 faits atomiques en JSONL, L2 scenario blocks en Markdown, L3 persona utilisateur en Markdown en haut. Les tiers du haut préservent la structure, ceux du bas préservent l'évidence, et chaque retrieval vient avec un `node_id` + `result_ref` pour que l'agent puisse drill-down de manière déterministe quand le fait au niveau persona ne suffit pas. Pour qui ship des agents qui roulent plus que quelques turns, c'est l'architecture publiée la plus propre pour le problème de mémoire à date.

Les chiffres sur sessions long-horizon continues (pas single-turn lookups, ce qui est le bon benchmark) : SWE-bench 58,4% → 64,2% avec le plugin activé (+9,9% relatif), usage de tokens en baisse de 33%. WideSearch 33% → 50% (+51,5%), tokens en baisse de 61%. AA-LCR 44,0% → 47,5%, tokens en baisse de 31%. PersonaMem 48% → 76% (+59%). Defaults : SQLite avec extension sqlite-vec, zéro dépendance API externe, fichiers Markdown à `~/.openclaw/memory-tdai/`. Recall a un timeout de 5 secondes et sur timeout le système skip l'injection plutôt que de bloquer — donc un retrieval lent ne peut pas staller la loop d'agent. Hybride BM25 + vector via Reciprocal Rank Fusion, top-5 par défaut. Extraction L1 faits atomiques aux 5 turns ; régénération persona aux 50 nouvelles mémoires.

La lecture ecosystem : Mem0, Letta, MemGPT et Zep se partagent l'agent-memory depuis deux ans, mais le breakdown 4-tiers est la delta architecturale. La plupart des systèmes existants soit flattenent tout dans un vector index (Mem0, Zep) soit maintiennent un split hot/cold (MemGPT). L'approche pyramide te donne Persona-as-Markdown (auditable par l'utilisateur, lisible humain, easy to edit), Atomic-as-JSONL (structuré, parseable, clés de drill-down), et raw logs au plancher. C'est un système mémoire white-box que tu peux debug avec `grep`. Tencent a laissé les benchmarks head-to-head contre Mem0/Letta/MemGPT/Zep hors de la release — flag l'astérisque — mais le delta SWE-bench avec une coupe tokens de 33%, c'est le genre de chiffre qui survit à la reproduction. Repo : github.com/Tencent/TencentDB-Agent-Memory.

Lundi matin : l'intégration est présentement lockée à OpenClaw de Tencent (single npm package `@tencentdb-agent-memory/memory-tencentdb`, besoin de Node.js 22.16+) ou Hermes Agent (Docker only). Pas de bindings LangChain ni LlamaIndex en v1 — c'est le gap communautaire évident si tu veux utiliser l'archi 4-tiers sous ton harness existant. Si ton agent brûle des tokens à replayer l'historique de conversation à chaque turn et que t'attendais une baseline publiée avant de bâtir ton propre système de mémoire, clone le repo, lis le schéma L0→L3, et décide si tu wrappes ou si tu réimplémentes l'architecture contre ta stack. Les chiffres benchmarks sont crédibles ; le coût d'intégration est le trade.

Mémoire agent 4-tiers de Tencent : SWE-bench 58,4 à 64,2%, SQLite local, MIT

Plus de nouvelles