El bucle del agente: (1) observar el estado actual (qué se ha hecho, qué información está disponible), (2) planificar la siguiente acción (usando el razonamiento del LLM), (3) ejecutar la acción (llamada a herramienta, ejecución de código, solicitud API), (4) observar el resultado, (5) decidir si continuar, ajustar o completar. Este bucle observar-planificar-actuar se repite hasta que la tarea está hecha o el agente se queda atascado y pide ayuda.
El desafío fundamental: cada paso en el flujo de trabajo de un agente tiene alguna probabilidad de error (elección incorrecta de herramienta, razonamiento incorrecto, resultado mal interpretado). En un flujo de trabajo de 10 pasos, incluso con un 95% de precisión por paso, la precisión general es solo del 60%. Por eso los agentes actuales funcionan mejor para tareas que son algo tolerantes a errores individuales (investigación, lluvia de ideas) y tienen dificultades con tareas que requieren precisión en cada paso (transacciones financieras, documentos legales).
La mayoría de los despliegues de agentes en producción incluyen supervisión humana: el agente propone acciones, un humano aprueba o corrige, y el agente continúa. Este enfoque de "humano en el bucle" sacrifica autonomía completa por confiabilidad. La tendencia es hacia mayor autonomía para acciones de bajo riesgo (leer archivos, buscar) y aprobación humana para acciones de alto riesgo (enviar correos electrónicos, hacer compras, modificar sistemas de producción). El nivel correcto de autonomía depende del costo de los errores.