Grafana Labs a utilisé GrafanaCON 2026 à Barcelone pour expédier un lot de mises à jour qui tombent dans une thèse propre : l'observabilité pour les agents d'IA pis les apps LLM est une vraie catégorie de produit, pis Grafana veut être là où tu instrumentes. Plusieurs pièces ont atterri ensemble : preview d'AI Observability dans Grafana Cloud, un nouveau CLI qui accroche Claude Code pis GitHub Copilot dans Grafana, le Grafana Assistant maintenant disponible sur le tier entreprise, un Loki reconstruit, pis o11y-bench, un outil de benchmarking d'agent open source.

AI Observability (preview public sur Grafana Cloud) instrumente les entrées, sorties pis flux d'exécution des agents, pis surveille les réponses de faible qualité, les violations de politiques, l'exposition de données, pis les credentials qui fuient. Le Grafana Cloud CLI (GCX) est la pièce plus intéressante pour les builders, une interface agentique qui te laisse invoquer le Grafana Assistant directement depuis Claude Code ou GitHub Copilot, tirant les données d'observabilité dans ta boucle de coding au lieu de forcer un changement de contexte. Grafana Loki a été reconstruit sur une architecture Apache Kafka, pis les chiffres que Grafana a divulgués sont concrets : amélioration de 10× en performance sur les requêtes agrégées en scannant 20× moins de données. Grafana Assistant est maintenant sur le tier entreprise avec un workspace plein écran pis une API pour l'intégration d'outils tiers. o11y-bench mesure à quel point les agents d'IA performent des tâches du monde réel contre une stack Grafana live.

La reconstruction de Loki compte tranquillement. La performance des requêtes de logs agrégés est ce qui rend l'observabilité utilisable à l'échelle, pis un 10× avec 20× moins de données scannées est le genre de revendication d'efficacité qui baisse directement les factures d'observabilité pour n'importe qui roulant Grafana Cloud ou Loki self-hosted. L'intégration Claude Code pis GitHub Copilot est le pari plus stratégique. Elle positionne Grafana comme le plan d'observabilité que tu interroges depuis l'intérieur de tes outils de coding assistés par IA plutôt que comme une UI séparée. Entre ça, Grafana Assistant atteignant l'entreprise, pis o11y-bench comme outil de benchmarking open source, l'image est Grafana qui essaie de posséder la question « où observes-tu tes agents d'IA » avant qu'Arize, WhyLabs, les features IA d'Honeycomb, ou les options hyperscaler-natives verrouillent la catégorie.

Deux choses si t'opères du logiciel connecté à l'IA. Un, le pattern CLI-agentique se répand — Claude Code a son outil Agent, Gemini CLI a expédié des sous-agents la semaine dernière, pis maintenant Grafana Cloud CLI accroche dans les deux CLIs de dev directement. La tendance est claire : ton observabilité, ton débogage, tes requêtes d'ops vont toutes de plus en plus se passer dans la boucle d'agent plutôt que dans des onglets séparés, pis les fournisseurs d'instrumentation courent pour être dans cette boucle. Deux, si tu roules Loki à l'échelle, la revendication de 10× sur les requêtes agrégées vaut la peine d'être mesurée contre ta charge de travail réelle dans le prochain quart. Si l'accélération tient sur ta forme de trafic, les économies sont réelles.