A Nvidia anunciou — enterrado no rodapé de um blog post de atualização do driver Game Ready — que a versão laptop da GeForce RTX 5070 recebe um aumento de memória de 8 GB para 12 GB de GDDR7, um aumento de 50 por cento. Todo o resto permanece idêntico: ainda uma interface de memória de 128 bits, ainda 4.608 núcleos CUDA, ainda o die de silício GB206 (o mesmo que a Nvidia usa para a RTX 5060 desktop, notavelmente mais fraco que o GB205 na 5070 desktop). A Framework, fabricante de laptops modulares, foi a primeira a se comprometer, colocando o novo módulo de 12 GB num Framework Laptop 16 atualizado. O porém apareceu imediatamente: o módulo GPU avulso custa US$ 1.199 contra US$ 699 pela versão de 8 GB — um aumento de 71,5 por cento pelo que de outra forma é o mesmo chip com mais memória soldada em cima.
O preço é a história, não o bump de specs. A Framework culpou explicitamente "os preços que estamos vendo dos fornecedores de silício" e alertou que o preço do módulo de 8 GB também provavelmente vai subir uma vez esgotado o inventário atual de GDDR7. Isso é o derrame do lado do consumidor do aperto de memória dos data centers — a produção de HBM e GDDR7 foi redirecionada para construções de IA de hyperscalers, deixando o mercado gaming e prosumer pagando preços de surge pelo que antes era capacidade commodity. Rumores anteriores sugeriam que o refresh "Super" planejado para a série RTX 50 — que teria aumentado a memória em toda a linha — foi silenciosamente adiado ou cancelado pela mesma razão. A 5070 móvel de 12 GB é o que passa pela brecha; um upgrade de SKU único em vez de um refresh em escala de geração.
Para cargas de IA local, o salto de 8 GB para 12 GB é a diferença entre "mal utilizável" e "funcional para a maioria das coisas". 8 GB não conseguia caber modelos classe Llama 8B em FP16, e 7B em int4 não deixava margem para contexto. 12 GB cabe confortavelmente 7B em FP16 com comprimento de contexto razoável, 13B em int4 com espaço para cache KV, e deixa você rodar fluxos de dev comuns como autocompletar código local sem fault para RAM. Isso faz da 5070 móvel a GPU de laptop de mais baixa categoria que é realmente viável para um dev que quer inferência on-device significativa — mas a US$ 1.199 pelo módulo só, a matemática de valor se comprimiu. Uma RTX 4070 Super desktop usada (12 GB) sai por US$ 500-600 agora, e os laptops Apple série M com memória unificada ainda igualam ou batem isso em pura adequação de modelo por dólar.
Para builders, duas leituras. Primeiro, o lado de GPU de consumo da bifurcação de IA agora está visível: o prêmio de memória do data center está sangrando no preço de laptops, e o limiar de 12 GB para trabalho LLM local efetivamente virou uma decisão de componente de US$ 1.200+ independente do fornecedor. Se você especifica hardware de dev, pese o caminho de upgrade Framework (modular mas caro) contra MacBook Pro série M (fechado mas mais barato por GB) e desktops workstation refurbished com 4090/3090 usadas — os últimos continuam sendo os vencedores na razão preço-VRAM. Segundo, observe se AMD ou Intel usam o guarda-chuva de preço da Nvidia para aterrissar agressivamente em placas de consumo de 16 GB e mais; o gap está mais largo do que esteve em anos, e o segmento laptop de IA é genuinamente disputável pela primeira vez desde 2024. O atraso do refresh "Super" não é só um problema da Nvidia — é uma abertura para todos os outros.
