Comment Slack roule des workflows d'agents longs : remplacer le contexte chat-log par un directeur, des critiques pis une timeline distillée

Les ingénieurs de Slack ont publié une explication d'architecture — reprise par InfoQ le 28 avril — qui décrit comment ils gèrent le contexte dans des systèmes multi-agents à longue durée, où une application peut s'étendre sur des centaines de requêtes pis générer des mégaoctets de sortie. Les frameworks d'agents standard accumulent l'historique de chat entre les appels, mais dans des sessions de production longues, cette approche atteint le plafond du context window pis dégrade la qualité des réponses bien avant la limite dure. L'ingénieur principal Dominic Marks décrit l'alternative : remplacer l'accumulation de chat logs par des canaux de mémoire structurés, des agents critiques dédiés, pis une timeline distillée qui survit pendant toute la durée de vie du run.

L'architecture, c'est un pattern coordinator/dispatcher. Un coordinateur central reçoit les requêtes pis les achemine vers des agents spécialisés en aval — des experts qui font le vrai travail, pis des critiques qui évaluent la sortie des experts. Les critiques sont nécessaires parce que (selon Slack) une portion des trouvailles d'experts « peut être soit inventée, soit interpréter grossièrement les données ». Trois canaux de contexte structurés portent l'état en cours à la place d'un chat log non borné. Le journal du directeur garde la mémoire de travail structurée du directeur — trouvailles, observations, décisions, questions ouvertes, hypothèses — pis il est décrit comme « la narrative commune qui garde les autres agents sur la track ». La review du critique, c'est un rapport de trouvailles annoté avec des scores de crédibilité, bâti par des critiques instruits étroitement à « porter un jugement seulement sur les trouvailles soumises » — fait que, pas de dérive, pas d'invention. La timeline du critique bâtit une narrative cohérente à partir du journal du directeur, de la dernière review pis de la timeline précédente, en dédupliquant les trouvailles pis en résolvant les conflits par préférence pour la preuve pondérée par crédibilité.

Le pattern compte parce que la stratégie d'accumulation de chat logs qui marche pour des interactions courtes en agent unique se met pas à l'échelle des workflows de production multi-étapes. Trois choses que le design de Slack implique sont rendues du gros bon sens d'industrie pour les agents à longue durée : les agents critiques sont nécessaires parce que les agents experts hallucinent à des taux significatifs; la mémoire structurée bat l'historique de chat brut parce qu'elle force la résumation pis le scoring de crédibilité; pis la distillation narrative ordonnée dans le temps — la « timeline » de Slack — est nécessaire pour garder les agents cohérents sur des centaines de requêtes. Le pattern est généralisable : n'importe quelle équipe qui roule des workflows multi-agents qui s'étalent sur des minutes à des heures plutôt que sur des secondes va avoir besoin d'une forme de séparation directeur/critique/timeline, ou d'un équivalent proche. Les noms exacts pis les structures de canaux vont varier, mais les trois rôles — porteur de narrative, scoreur de crédibilité, bâtisseur de timeline — vont probablement converger entre frameworks.

Pour les builders, trois choses concrètes. Premièrement, si tu bâtis des workflows agentiques qui s'étalent sur plus qu'une fenêtre de chat d'état, accumule pas juste l'historique de messages — design des canaux de mémoire structurés avec des métadonnées de crédibilité dès le jour un. Rétrofitter ce pattern plus tard, c'est douloureux. Deuxièmement, les agents critiques contraints à « juger seulement les trouvailles soumises », c'est la défense anti-hallucination la moins chère que Slack a trouvée : scope étroit plus rôle dédié plus scoring de crédibilité. Bâtis ça dans ta couche multi-agents au lieu d'espérer que l'agent expert va attraper ses propres erreurs. Troisièmement, la culture d'ingénierie compte : Slack publie cette architecture publiquement, ce qui veut dire que les frameworks open source futurs vont probablement standardiser sur quelque chose comme coordinator/director/critic/timeline. Surveille LangGraph, AutoGen pis CrewAI pour voir ce pattern atterrir comme abstraction de première classe dans les prochains mois.

Comment Slack roule des workflows d'agents longs : remplacer le contexte chat-log par un directeur, des critiques pis une timeline distillée

Plus de nouvelles