Google a lancé Gemma 4 avec quatre variantes de modèles et est passé à la licence Apache 2.0, abandonnant la licence Gemma personnalisée restrictive qui frustrait les développeurs depuis plus d'un an. La gamme inclut 26B Mixture of Experts, 31B Dense, et deux modèles optimisés pour mobile (E2B et E4B) conçus pour smartphones et appareils edge. Google affirme que la variante 31B se classera troisième au classement des modèles ouverts d'Arena, bien qu'elle soit considérablement plus petite que les leaders GLM-5 et Kimi 2.5.
Le changement de licence compte plus que les modèles eux-mêmes. Comme je l'ai déjà couvert, la licence Gemma personnalisée de Google créait une incertitude légale qui tenait plusieurs développeurs à l'écart de modèles pourtant capables. Apache 2.0 élimine cette friction, faisant potentiellement de Gemma 4 le choix privilégié pour les applications commerciales qui ont besoin d'une licence vraiment ouverte. Le timing s'aligne avec la demande croissante des entreprises pour des modèles qu'elles peuvent modifier et redistribuer sans casse-tête de licence.
Le marketing « local » de Google reste trompeur malgré les améliorations techniques. Oui, les modèles 26B et 31B fonctionnent sur un seul GPU H100, mais c'est un équipement de 20 000 $ que la plupart des développeurs ne toucheront jamais. Les modèles mobiles sont plus réalistes pour un déploiement local réel, mais les affirmations de Google sur la « latence quasi nulle » nécessitent des tests en conditions réelles. L'appel de fonctions et la sortie JSON structurée sont maintenant des standards, pas des fonctionnalités révolutionnaires.
Pour les développeurs, le passage à Apache 2.0 est la vraie nouvelle ici. Si vous évitiez Gemma à cause des préoccupations de licence, cette barrière a disparu. Les variantes mobiles pourraient être intéressantes pour les applications edge, mais attendez les benchmarks indépendants avant de croire aux affirmations de performance de Google. Les exigences matérielles pour les modèles plus gros restent un rappel à la réalité sur ce que « IA locale » signifie vraiment en 2024.
