La boucle agentique : (1) observer l'état actuel (ce qui a été fait, quelle information est disponible), (2) planifier la prochaine action (en utilisant le raisonnement du LLM), (3) exécuter l'action (appel d'outil, exécution de code, requête API), (4) observer le résultat, (5) décider de continuer, ajuster ou terminer. Cette boucle observer-planifier-agir se répète jusqu'à ce que la tâche soit terminée ou que l'agent soit bloqué et demande de l'aide.
Le défi fondamental : chaque étape dans le workflow d'un agent a une certaine probabilité d'erreur (mauvais choix d'outil, raisonnement incorrect, résultat mal interprété). Sur un workflow de 10 étapes, même une précision de 95 % par étape se compose en seulement 60 % de succès global. C'est pourquoi les agents actuels fonctionnent le mieux pour des tâches qui tolèrent les erreurs individuelles (recherche, brainstorming) et peinent avec les tâches nécessitant de la précision à chaque étape (transactions financières, documents juridiques).
La plupart des déploiements d'agents en production incluent une supervision humaine : l'agent propose des actions, un humain approuve ou corrige, et l'agent continue. Cette approche « humain dans la boucle » sacrifie l'autonomie complète pour la fiabilité. La tendance est vers une autonomie plus large pour les actions à faible risque (lire des fichiers, chercher) et l'approbation humaine pour les actions à haut risque (envoyer des courriels, faire des achats, modifier des systèmes en production). Le bon niveau d'autonomie dépend du coût des erreurs.