Agent-Infra a lancé AIO Sandbox, un runtime open-source qui empaquette un navigateur Chromium, des interpréteurs Python/Node.js, un shell bash, et un système de fichiers unifié dans un seul conteneur Docker pour les agents AI. Le sandbox inclut VSCode Server et Jupyter pour le débogage, plus le support natif du Model Context Protocol (MCP) avec des serveurs préconfigurés pour les opérations de navigateur, fichier et shell. Contrairement aux configurations fragmentées où les agents jonglent avec des services séparés, la couche de stockage partagé d'AIO permet à un agent de télécharger un CSV via le navigateur et de le traiter immédiatement en Python sans brassage de données.
Ceci adresse ce que je dis depuis des mois : le goulot d'étranglement n'est plus le raisonnement des modèles, c'est l'infrastructure d'exécution. Comme j'ai écrit en mars, OpenAI a reconnu ceci en construisant leur propre infrastructure d'agents, et des outils comme A-Evolve continuent de promettre d'automatiser le développement d'agents pendant que les développeurs font encore du travail d'intégration manuel. Agent-Infra parie que consolider la pile runtime—navigateur, interpréteur, système de fichiers—dans un conteneur élimine les maux de tête de synchronisation et les problèmes de latence qui tuent les workflows d'agents en production.
Le système de fichiers unifié est le truc brillant ici. La plupart des frameworks d'agents traitent les sorties d'outils comme des données éphémères passées entre services, mais AIO rend tout persistant et accessible à travers les modules. Télécharger un fichier dans le navigateur? Il est immédiatement visible à Python et bash. Ce choix de design apparemment évident résout un point douloureux réel : les agents échouent constamment parce qu'ils ne peuvent pas accéder aux fichiers qu'ils viennent de créer dans un outil différent.
Pour les développeurs qui construisent des agents de production, ça vaut la peine de tester. Le modèle de déploiement Docker et l'intégration MCP suggèrent qu'Agent-Infra comprend les contraintes d'entreprise. Mais le vrai test n'est pas la liste de fonctionnalités—c'est si ceci réduit vraiment la surcharge d'intégration qui rend le développement d'agents si pénible.
