A startup Wafer está treinando modelos de IA para otimizar automaticamente software para qualquer arquitetura de chip, potencialmente quebrando o domínio da Nvidia sobre o ecossistema de software de performance. A empresa usa aprendizado por reforço em modelos de código aberto para escrever código kernel e adiciona "arneses agênticos" a modelos como Claude e GPT-4 para melhorar suas habilidades de codificação específicas para hardware. A Wafer já garantiu parcerias com AMD e Amazon, captando $4 milhões de investidores notáveis incluindo Jeff Dean do Google e Wojciech Zaremba da OpenAI.
Isso importa porque a avaliação de $4 trilhões da Nvidia não está construída apenas em silício superior—é o ecossistema de software CUDA deles que torna seus chips mais fáceis de programar e otimizar. Como o CEO da Wafer Emilio Andere aponta, "o melhor hardware AMD, o melhor hardware Trainium, os melhores TPUs" agora igualam o poder de computação bruto da Nvidia. O gargalo tem sido os engenheiros de performance escassos e caros necessários para liberar esse potencial. Se a IA conseguir automatizar esse trabalho de otimização, de repente todo chip se torna tão acessível quanto os da Nvidia.
A narrativa mais ampla de "democratização da IA" se estende muito além dos chips. Discussões da indústria revelam padrões similares na agricultura, onde especialistas debatem se a IA pode tornar tecnologia agrícola avançada acessível para pequenos agricultores, e em interfaces de computação geral, onde alguns argumentam que large language models se tornarão a UI universal que torna todo software mais fácil de usar. Mas o problema de otimização de chips é mais concreto—trata-se de automatizar uma tarefa de engenharia específica e mensurável ao invés de promessas vagas sobre "empoderar todo mundo".
Para desenvolvedores, isso pode remodelar escolhas de infraestrutura. Se a Wafer e ferramentas similares conseguirem otimizar código de forma confiável para chips alternativos, o prêmio da escassez de GPU e o lock-in do CUDA se tornam menos relevantes. O teste real será se otimizações geradas por IA conseguem igualar performance ajustada manualmente em cargas de trabalho de produção, não apenas benchmarks.
