AWS abrió Amazon WorkSpaces a los agentes de IA en preview esta semana — dándole a cualquier framework de agentes compatible con MCP, incluyendo LangChain, CrewAI y los Strands Agents propios de AWS, un escritorio virtual gestionado para operar aplicaciones legacy mediante visión por computadora y simulación de entrada. El agente se autentica vía IAM, se conecta a una instancia de WorkSpaces a través de una URL prefirmada, e interactúa como lo haría un empleado humano: tomando capturas, haciendo clic, tecleando, scrolleando. La aplicación destino no sabe que un agente la está manejando; nada del software necesita modificarse. AWS demostró el patrón con un agente Strands sobre Bedrock corriendo un flujo de renovación de receta en un sistema farmacéutico de muestra — búsqueda de paciente, búsqueda de medicación, colocación de la orden, confirmación de la recarga — todo sin API.

La arquitectura es más interesante que la demo. WorkSpaces expone un endpoint MCP gestionado como plano de control del agente, lo que deja al builder elegir el framework en lugar de quedar atado a runtimes AWS-nativos. La seguridad hereda el modelo de WorkSpaces humanos: instancias aisladas, identidades IAM únicas por agente (para que CloudTrail distinga acciones agénticas de las humanas), observabilidad CloudWatch, y capacidades configurables por stack — resolución, formato de imagen, almacenamiento de capturas, habilitación de entrada. La realidad de costo honesta es lo que la mayoría de las lecturas se va a saltar: el benchmark reciente de Reflex mostró que un agente de visión consumió aproximadamente 500 000 tokens de input para completar una tarea que un agente por API resolvió en 12 000 — una brecha de 45×, con el agente de visión tardando 17 minutos contra 20 segundos. Palash Awasthi de Reflex lo planteó claramente: "Mejores modelos de visión reducen la tasa de error por captura, pero no reducen el número de capturas necesarias para llegar a los datos relevantes."

La lectura ecosistémica acá es de dos vías. AWS apuesta a que el 75% de las organizaciones que Gartner marcó como aún corriendo apps legacy sin APIs modernas — y el 71% de Fortune 500 con procesos críticos en mainframe — elegirán un agente 45× más caro antes que un proyecto de modernización de varios años, porque las cuentas dan al pricing empresarial. La plomería MCP importa más que la marca WorkSpaces: este es el primer endpoint MCP gestionado en forma de escritorio cloud, lo que lo convierte en la contraparte cloud del computer-use de Claude de Anthropic y del Operator de OpenAI. Microsoft construye la misma categoría con Windows 365 para agentes de IA. El cuello de botella ya no es si los agentes pueden manejar GUIs (Claude 3.5 Sonnet computer-use lo mostró a fines de 2024); es quién hostea el escritorio donde corre el agente. AWS acaba de apostar por esa capa con una puerta MCP.

Para builders desplegando agentes en industrias reguladas: el patrón IAM por agente, la auditoría CloudTrail y el modelo de instancia aislada son las piezas a copiar si construís en otro lado — los reguladores van a querer exactamente esa traza, no un cuento de "confía en el agente". Para builders evaluando computer-use vs integración API: hacé la cuenta de tokens a tu escala y a la duración de tu flujo. La ruta por API de 20 segundos le gana a los agentes de visión de 17 minutos en costo cuando hay una API; en stacks legacy donde modernizar es un año de trabajo y siete cifras, un agente 45× más caro que se entrega la semana próxima es la opción racional. La preview está disponible en US East (N. Virginia, Ohio), US West (Oregon), Canada Central, cuatro regiones europeas y cinco regiones de Asia-Pacífico, con código de muestra en GitHub.