Chip brain-inspired de Cambridge: 70% menos energia AI, mas barreira de fab de 700°C, Zubnet AI Notícias

O Department of Materials Science de Cambridge publicou um paper na Science Advances descrevendo um memristor — um tipo de componente de chip que combina memória e computação no mesmo lugar — construído a partir de um hafnium oxide modificado. Os números são impressionantes: correntes de switching cerca de um milhão de vezes menores que memristors oxide convencionais, centenas de níveis distintos de condutância analog estáveis (em vez de binário on/off), e uma reivindicação manchete de até 70% de redução no uso de energia AI comparado aos chips digitais atuais. O mecanismo se assemelha a como sinapses cerebrais funcionam — ajuste analog gradual de força de conexão em vez de estado digital discreto. O autor líder Dr. Babak Bakhit nota a barreira principal: o processo de fabricação atualmente requer temperaturas em torno de 700°C, o que é incompatível com linhas padrão de manufatura de semicondutores que toppean mais baixo.

O que isso é e o que não é. Memristors não são novos — foram teoricamente descritos em 1971 e fisicamente realizados em 2008 — mas memristors práticos, eficientes em energia e manufaturáveis têm sido a fronteira de pesquisa por duas décadas. A contribuição de Cambridge é ciência de materiais: em vez de depender de switching filamentar (onde caminhos condutivos minúsculos se formam e quebram, o que é caprichoso e high-energy), engenheirizaram o hafnium oxide com strontium e titanium adicionados mais um processo de crescimento de duas etapas para criar p-n junctions nas interfaces — como versões microscópicas das gates que já existem na eletrônica semicondutora padrão. Essa escolha lhes dá os níveis analog estáveis necessários para «in-memory computing», em que os mesmos componentes físicos armazenam dados e fazem a matemática, eliminando as viagens entre memória e processador que consomem a maior parte do orçamento de energia de um chip moderno. O número 70% é significativo como reivindicação de categoria sobre neuromorphic computing em geral, menos como propriedade verificada deste dispositivo específico contra uma baseline específica.

Por que isso importa para não-especialistas. A pegada energética da AI se tornou uma conversa pública real — data centers comprando PPAs nucleares, town boards rejeitando facilities compute por uso de água e energia, labs frontier falando abertamente sobre data centers orbitais porque restrições terrestres estão mordendo. A arquitetura atual (memória e compute separados, com dados transbordando entre eles) é o que torna a AI tão faminta por energia, não a matemática em si. Chips neuromorphic que computem in-place poderiam em princípio cortar a conta elétrica de inferência AI numa ordem de grandeza, da mesma forma que o cérebro roda a cerca de 20 watts versus os kilowatts que um modelo classe-Llama precisa para raciocínio similar. Se este dispositivo Cambridge específico chega lá ou fica como protótipo de pesquisa depende quase inteiramente de se alguém pode re-engenheirar a fabricação para rodar em temperaturas CMOS padrão (abaixo de ~450°C). Múltiplos labs estão trabalhando em processos de memristor de temperatura mais baixa; o time de Cambridge não reivindica que crackou isso, só que têm um dispositivo analog estável digno de integrar uma vez que o problema de temperatura seja resolvido.

O que realmente esperar. Neuromorphic computing tem estado «a cinco anos» por quinze anos; esse paper não muda essa timeline dramaticamente. O que ele faz é adicionar mais uma arquitetura credível ao pipeline de abordagens que poderiam plausivelmente funcionar em escala, ao lado do Loihi da Intel, do NorthPole da IBM e vários esforços de startups (Rain AI, BrainChip, Synthara). Para usuários do dia a dia, a expectativa honesta é que as melhorias de eficiência energética AI nos próximos três anos vão vir de otimização algorítmica (model distillation, speculative decoding, compressão de KV cache) e melhor silício digital (Blackwell → Rubin, AMD MI400, Google TPU 8) em vez de chips neuromorphic. Passado 2028, se labs conseguirem resolver a restrição de temperatura de manufatura que o paper Cambridge destaca, aceleradores neuromorphic poderiam se mover de pesquisa para deployment especializado — provavelmente primeiro em dispositivos edge (always-on voice, análise de sensores) onde a matemática watts-economizados é mais convincente, e só depois em inferência de data center. O paper é progresso real; a timeline continua medida em gerações de chip-fab, não ciclos de produto.

Chip brain-inspired de Cambridge: 70% menos energia AI, mas barreira de fab de 700°C

Mais notícias