Engenheiros do Slack publicaram um detalhamento de arquitetura — coberto pela InfoQ em 28 de abril — sobre como gerenciam contexto em sistemas multi-agente de longa duração, onde uma aplicação pode abranger centenas de requests e gerar megabytes de saída. Frameworks de agentes padrão acumulam histórico de chat entre chamadas, mas em sessões de produção longas essa abordagem bate no teto do context window e degrada a qualidade das respostas bem antes do limite duro. O staff engineer Dominic Marks descreve a alternativa: substituir a acumulação de chat logs por canais de memória estruturados, agentes críticos dedicados e uma linha do tempo destilada que sobrevive durante toda a vida do run.

A arquitetura é um padrão coordinator/dispatcher. Um coordenador central recebe as requests e as direciona para agentes especializados a jusante — experts que fazem o trabalho de verdade, e críticos que avaliam a saída dos experts. Críticos são necessários porque (segundo o Slack) uma parte dos achados dos experts "pode estar inventada ou interpretar grosseiramente os dados." Três canais de contexto estruturados carregam o estado em curso em vez de um chat log ilimitado. O diário do diretor armazena a memória de trabalho estruturada do diretor — achados, observações, decisões, perguntas abertas, hipóteses — e é descrito como "a narrativa comum que mantém os outros agentes na linha." A revisão do crítico é um relatório de achados anotado com scores de credibilidade, construído por críticos instruídos estreitamente a "só fazer julgamento sobre os achados submetidos" — ou seja, sem deriva, sem invenção. A linha do tempo do crítico constrói uma narrativa coerente a partir do diário do diretor, da revisão mais recente e da linha do tempo anterior, deduplicando achados e resolvendo conflitos preferindo evidência ponderada por credibilidade.

O padrão importa porque a estratégia de acumulação de chat logs que funciona para interações curtas em agente único não escala para workflows de produção multi-passo. Três coisas que o design do Slack implica são agora senso comum de indústria para agentes de longa duração: agentes críticos são necessários porque agentes expert alucinam em taxas significativas; memória estruturada bate histórico de chat cru porque força sumarização e scoring de credibilidade; e destilação narrativa ordenada no tempo — a "linha do tempo" do Slack — é necessária para manter agentes coerentes ao longo de centenas de requests. O padrão é generalizável: qualquer time rodando workflows multi-agente que abrangem minutos a horas em vez de segundos vai precisar de alguma forma de split diretor/crítico/linha-do-tempo, ou um equivalente próximo. Os nomes exatos dos canais e estruturas vão variar, mas os três papéis — portador de narrativa, scorer de credibilidade, construtor de linha do tempo — provavelmente convergem entre frameworks.

Para os builders, três coisas concretas. Primeiro, se você constrói workflows agentic que abrangem mais que o estado de uma única janela de chat, não acumule só histórico de mensagens — desenhe canais de memória estruturados com metadados de credibilidade desde o primeiro dia. Retrofitar esse padrão depois é doloroso. Segundo, agentes críticos restritos a "só julgar os achados submetidos" são a defesa mais barata contra alucinação que o Slack encontrou: escopo estreito mais papel dedicado mais scoring de credibilidade. Construa isso na sua camada multi-agente em vez de esperar que o agente expert pegue os próprios erros. Terceiro, a cultura de engenharia importa: o Slack está publicando essa arquitetura publicamente, o que significa que frameworks open source futuros provavelmente padronizam em algo como coordinator/diretor/crítico/linha-do-tempo. Acompanhe LangGraph, AutoGen e CrewAI para esse padrão pousar como abstração de primeira classe nos próximos meses.