O Google lançou o Gemma 4 com quatro variantes de modelo e mudou para licenciamento Apache 2.0, abandonando a licença Gemma personalizada restritiva que frustrou desenvolvedores por mais de um ano. A linha inclui 26B Mixture of Experts, 31B Dense, e dois modelos otimizados para mobile (E2B e E4B) projetados para smartphones e dispositivos edge. O Google afirma que a variante 31B ficará em terceiro no leaderboard de modelos abertos da Arena, embora seja significativamente menor que os líderes GLM-5 e Kimi 2.5.

A mudança de licenciamento importa mais que os próprios modelos. Como já cobri antes, a licença Gemma personalizada do Google criava incerteza legal que mantinha muitos desenvolvedores longe de modelos que eram capazes. O Apache 2.0 remove esse atrito, potencialmente fazendo do Gemma 4 a escolha principal para aplicações comerciais que precisam de licenciamento verdadeiramente aberto. O timing se alinha com a crescente demanda empresarial por modelos que podem modificar e redistribuir sem dores de cabeça de licenciamento.

O marketing "local" do Google continua enganoso apesar das melhorias técnicas. Sim, os modelos 26B e 31B rodam em uma única GPU H100, mas isso é um hardware de R$ 100 mil que a maioria dos desenvolvedores nunca vai tocar. Os modelos mobile são mais realistas para deployment local de verdade, mas as alegações do Google de "latência quase zero" precisam de testes no mundo real. Chamadas de função e saída JSON estruturada já são padrão básico, não recursos revolucionários.

Para desenvolvedores, a mudança para Apache 2.0 é a verdadeira notícia aqui. Se você estava evitando Gemma por preocupações de licenciamento, essa barreira sumiu. As variantes mobile podem ser interessantes para aplicações edge, mas esperem benchmarks independentes antes de acreditar nas alegações de performance do Google. Os requisitos de hardware para os modelos maiores continuam sendo um banho de realidade sobre o que "IA local" realmente significa em 2024.