Memória de agente 4-tier da Tencent: SWE-bench 58,4 a 64,2%, SQLite local, MIT

A Tencent soltou um release sério de memória de agente sob MIT essa semana — TencentDB Agent Memory, uma pirâmide de 4 tiers que resolve o problema de context-bloat long-horizon que a maioria dos shops de agente ainda contorna na mão. A forma: L0 logs de conversa crua na base, L1 fatos atômicos em JSONL, L2 scenario blocks em Markdown, L3 persona de usuário em Markdown no topo. Tiers superiores preservam estrutura, inferiores preservam evidência, e cada retrieval vem com `node_id` + `result_ref` pra o agente fazer drill-down determinístico quando o fato no nível persona não basta. Pra quem shippa agentes que rodam mais que um punhado de turns, essa é a arquitetura publicada mais limpa pro problema de memória até agora.

Números em sessões long-horizon contínuas (não single-turn lookups, que é o benchmark certo): SWE-bench 58,4% → 64,2% com o plugin ativado (+9,9% relativo), uso de tokens caiu 33%. WideSearch 33% → 50% (+51,5%), tokens caíram 61%. AA-LCR 44,0% → 47,5%, tokens caíram 31%. PersonaMem 48% → 76% (+59%). Defaults: SQLite com extensão sqlite-vec, zero dependência de API externa, arquivos Markdown em `~/.openclaw/memory-tdai/`. Recall tem timeout de 5 segundos e em timeout o sistema skipa injection ao invés de bloquear — então um retrieval lento não pode travar o loop do agente. Híbrido BM25 + vector via Reciprocal Rank Fusion, top-5 por padrão. Extração L1 de fatos atômicos a cada 5 turns; regeneração de persona a cada 50 novas memórias.

Leitura ecossistema: Mem0, Letta, MemGPT e Zep dividem agent-memory faz dois anos, mas o breakdown 4-tier é a delta arquitetural. A maioria dos sistemas existentes ou achata tudo num vector index (Mem0, Zep) ou mantém um split hot/cold (MemGPT). A abordagem pirâmide te dá Persona-as-Markdown (auditável pelo usuário, legível humano, easy to edit), Atomic-as-JSONL (estruturado, parseável, chaves de drill-down), e raw logs no chão. É um sistema de memória white-box que dá pra debugar com `grep`. Tencent deixou os benchmarks head-to-head contra Mem0/Letta/MemGPT/Zep fora do release — flag o asterisco — mas o delta SWE-bench com corte de 33% de tokens é o tipo de número que sobrevive reprodução. Repo: github.com/Tencent/TencentDB-Agent-Memory.

Segunda de manhã: a integração tá atualmente travada no OpenClaw da Tencent (single npm package `@tencentdb-agent-memory/memory-tencentdb`, precisa Node.js 22.16+) ou Hermes Agent (só Docker). Sem bindings LangChain ou LlamaIndex em v1 — esse é o gap comunitário óbvio se você quiser usar a arquitetura 4-tier sob teu harness existente. Se teu agente queima tokens reproduzindo histórico de conversa em cada turn e você tava esperando uma baseline publicada antes de construir teu próprio sistema de memória, clone o repo, leia o schema L0→L3, e decida se envelopa ou reimplementa a arquitetura contra tua stack. Os números benchmark são críveis; o custo de integração é o trade.

Memória de agente 4-tier da Tencent: SWE-bench 58,4 a 64,2%, SQLite local, MIT

Mais notícias