Google a déployé la génération de modèles 3D interactifs pour Gemini cette semaine, permettant aux utilisateurs de créer des simulations qu'ils peuvent manipuler en temps réel. Demandez une lune en orbite autour de la Terre, et vous obtenez un modèle 3D avec des curseurs de vitesse, des boutons de trajectoire orbitale et des contrôles de rotation. La fonctionnalité marche avec le modèle Pro de Gemini et répond à des demandes comme « montre-moi un pendule double » ou « aide-moi à visualiser l'effet Doppler ». Les utilisateurs cliquent ensuite sur « Montre-moi la visualisation » pour activer les éléments interactifs.

Ça ressemble moins à de l'innovation et plus à du minimum syndical. Anthropic a donné à Claude la génération automatique de graphiques il y a des semaines, pendant qu'OpenAI ajoutait des visualisations mathématiques et scientifiques à ChatGPT vers la même période. Google rattrape son retard dans un espace où les réponses visuelles d'IA deviennent attendues, pas impressionnantes. La vraie question, c'est pas si Gemini peut rendre une planète qui tourne — c'est si ces modèles 3D sont assez précis pour un vrai apprentissage ou juste des démos flashy.

Ce qui est révélateur, c'est comment Google présente ça comme une « amélioration » quand c'est vraiment de la parité de fonctionnalités. La structure de prix de la compagnie révèle leurs priorités : l'accès de base est gratuit, mais les bonnes affaires demandent des niveaux payants. Pendant que les concurrents se concentrent à rendre leur IA plus utile par défaut, Google semble plus intéressé à créer des chemins de mise à niveau. Les modèles 3D marchent, mais ils sont bloqués derrière la sélection de modèle et demandent des patterns de demande spécifiques.

Pour les développeurs, ça signale où l'industrie s'en va — les sorties multimodales sont plus optionnelles. Si vous construisez des produits IA, les utilisateurs vont s'attendre à des réponses visuelles, pas juste du texte. Mais ne vous laissez pas distraire par le brillant 3D. Concentrez-vous sur la précision et l'utilité plutôt que sur le clinquant visuel, parce que c'est là que vit la vraie valeur.