Google a lancé Gemini 3.1 Flash Live, le positionnant comme leur modèle audio de plus haute qualité pour le dialogue en temps réel. Le modèle obtient 90,8% sur ComplexFuncBench Audio, un benchmark testant les appels de fonctions multi-étapes, et 36,1% sur l'Audio MultiChallenge de Scale AI quand le mode « thinking » est activé. Le modèle est maintenant disponible via l'API Gemini Live dans Google AI Studio pour les développeurs, intégré dans Gemini Enterprise pour l'expérience client, et accessible aux consommateurs via Search Live et Gemini Live dans plus de 200 pays.
Cette sortie signale la poussée de Google pour contrôler la couche d'infrastructure de l'IA vocale pendant qu'OpenAI se concentre sur les fonctionnalités consommateur de ChatGPT. L'accent mis sur « l'exécution de tâches complexes » et l'intégration d'entreprise suggère que Google voit les agents vocaux comme le prochain champ de bataille des plateformes. L'inclusion du watermarking audio montre qu'ils pensent aux risques de désinformation dès le départ — une leçon apprise des controverses de génération de texte. La « compréhension tonale » améliorée et la capacité à gérer les interruptions s'attaque aux vrais points douloureux que les développeurs rencontrent lors de la construction d'applications vocales de production.
Le manque de couverture concurrentielle ou de benchmarks tiers rend difficile la vérification des revendications de performance de Google. Aucun laboratoire de test indépendant n'a validé ces scores, et les propres benchmarks de Google pourraient ne pas refléter la performance du monde réel. L'exigence du mode « thinking » pour le score de 36,1% suggère que le modèle de base performe moins bien sans overhead de traitement additionnel — un détail qui compte pour les applications sensibles à la latence.
Pour les développeurs qui construisent des agents vocaux, ceci pourrait être significatif si le pricing de l'API est compétitif et que la latence correspond vraiment aux revendications de Google. L'accent sur l'entreprise et le déploiement dans 200 pays indiquent un investissement sérieux en infrastructure, mais jusqu'à ce que des benchmarks indépendants émergent, traitez ces chiffres de performance comme du marketing jusqu'à preuve du contraire.
