À la base, un agent n'est qu'une boucle. Le modèle reçoit un objectif, décide d'une prochaine action (généralement un appel d'outil), observe le résultat, et répète jusqu'à ce que l'objectif soit atteint ou qu'il décide qu'il ne peut pas continuer. C'est parfois appelé le patron « ReAct » — Raisonner, Agir, Observer. Ce qui le rend puissant est que le modèle maintient un état entre les itérations : il se souvient de ce qu'il a déjà essayé, de ce qui a échoué, et des informations qu'il a recueillies. La boucle est orchestrée par un harnais — un morceau de code qui envoie des messages au modèle, exécute les appels d'outils que le modèle demande, et renvoie les résultats. Des frameworks comme LangChain, CrewAI et le propre Agent SDK d'Anthropic fournissent ce harnais, mais vous pouvez aussi en construire un en une cinquantaine de lignes de code. Le modèle lui-même n'« exécute » jamais rien ; il produit simplement du JSON structuré disant « appelle cette fonction avec ces arguments », et votre code fait le reste.
La différence pratique entre un bon agent et un agent frustrant réside dans la façon dont vous définissez ses outils et le degré d'autonomie que vous lui accordez. Un agent de codage comme Claude Code ou le mode agent de Cursor pourrait avoir des outils pour lire des fichiers, écrire des fichiers, exécuter des commandes shell et rechercher dans une base de code. Un agent de support client pourrait avoir des outils pour consulter des commandes, émettre des remboursements et escalader des tickets. La décision de conception clé est la granularité : trop peu d'outils et l'agent ne peut rien faire d'utile ; trop d'outils et il ne sait plus lequel choisir. En production, la plupart des équipes trouvent que 5 à 15 outils bien définis sont le point idéal. Chaque outil a besoin d'un nom clair, d'une bonne description (c'est ce que le modèle lit pour décider quand l'utiliser), et d'un schéma de paramètres bien typé.
L'une des plus grandes idées reçues sur les agents est qu'ils ont besoin d'architectures multi-agents élaborées pour être utiles. L'industrie est passée par une phase d'« essaims d'agents » et de patrons « crew » où l'on avait un agent planificateur, un agent chercheur, un agent rédacteur et un agent critique qui communiquaient entre eux. En pratique, un seul modèle dans une boucle serrée avec de bons outils surpasse généralement ces configurations complexes. Les patrons multi-agents ajoutent de la latence, du coût et des modes de défaillance. Ils ont du sens pour les charges de travail véritablement parallèles — par exemple, scanner dix dépôts simultanément — mais pour la plupart des tâches séquentielles, un seul agent avec des instructions claires fait le travail. Les entreprises qui livrent de vrais produits basés sur des agents (Anthropic, OpenAI, Google) ont convergé vers cette architecture plus simple.
La fiabilité est la partie difficile. Un agent qui fonctionne 90 % du temps semble bien jusqu'à ce que vous réalisiez que dans une tâche en 10 étapes, un taux de réussite de 90 % par étape vous donne environ 35 % de chances de compléter l'ensemble. C'est pourquoi les agents en production ont besoin de garde-fous : limites maximales d'itérations, plafonds de coûts, points de contrôle humains pour les actions dangereuses (comme supprimer des données ou dépenser de l'argent), et des modes de défaillance gracieux. Les meilleures implémentations d'agents incluent aussi une logique de nouvelle tentative avec backoff, une gestion d'erreurs structurée qui renvoie les échecs au modèle pour qu'il puisse essayer une approche différente, et un logging qui permet de retracer exactement ce qui s'est passé quand les choses tournent mal.
L'évolution des agents a été rapide. En 2023, AutoGPT est devenu viral mais était surtout une démo — il brûlait des tokens et complétait rarement des tâches complexes. En 2025, Claude Code, Devin et des outils similaires écrivaient du code de production, exécutaient des tests et livraient des pull requests avec une fiabilité réelle. La différence n'était pas seulement de meilleurs modèles ; c'était une meilleure conception des outils, un meilleur prompting et des leçons d'ingénierie durement acquises sur le fait de garder la boucle serrée. Si vous construisez un agent aujourd'hui, commencez avec une seule boucle, une poignée d'outils, et investissez votre temps à faire en sorte que ces outils retournent une sortie propre et utile. Cela compte plus que n'importe quel choix de framework.