Nvidia a annoncé — enterré au bas d'un blog post de mise à jour pilote Game Ready — que la version laptop de la GeForce RTX 5070 reçoit un boost de mémoire de 8 Go à 12 Go de GDDR7, une augmentation de 50 pour cent. Tout le reste reste identique : encore une interface mémoire 128 bits, encore 4 608 cœurs CUDA, encore le die silicium GB206 (le même que Nvidia utilise pour la RTX 5060 desktop, notablement plus faible que le GB205 dans la 5070 desktop). Framework, le fabricant de laptops modulaires, a été le premier à s'engager, en mettant le nouveau module 12 Go dans un Framework Laptop 16 mis à jour. Le hic est apparu tout de suite : le module GPU autonome coûte 1 199 $ contre 699 $ pour la version 8 Go — une augmentation de 71,5 pour cent pour ce qui est autrement la même puce avec plus de mémoire soudée dessus.

Le prix, c'est l'histoire, pas le bump de specs. Framework a explicitement blâmé « les prix qu'on voit des fournisseurs de silicium » pis a averti que le prix du module 8 Go est aussi susceptible de monter une fois l'inventaire GDDR7 actuel épuisé. C'est la propagation côté consommateur du resserrement mémoire des centres de données — la production HBM pis GDDR7 a été redirigée vers les constructions IA hyperscalers, laissant le marché gaming pis prosumer payer une tarification de surcharge pour ce qui était auparavant de la capacité commodité. Des rumeurs antérieures suggéraient que le refresh « Super » planifié de la série RTX 50 — qui aurait boosté la mémoire à travers la gamme — a été silencieusement retardé ou annulé pour la même raison. La 5070 mobile 12 Go, c'est ce qui passe à travers l'écart ; un upgrade SKU unique plutôt qu'un refresh à l'échelle de la génération.

Pour les charges IA locales, le saut de 8 Go à 12 Go, c'est la différence entre « à peine utilisable » pis « fonctionnel pour la plupart des affaires ». 8 Go pouvait pas faire entrer les modèles classe Llama 8B en FP16, pis 7B en int4 laissait aucune marge pour le contexte. 12 Go fait entrer confortablement 7B en FP16 avec une longueur de contexte raisonnable, 13B en int4 avec de la place pour le cache KV, pis te permet de faire rouler des workflows dev courants comme la complétion de code locale sans page-fault vers la RAM. Ça fait de la 5070 mobile le GPU laptop de plus bas niveau qui est réellement viable pour un dev qui veut de l'inférence on-device significative — mais à 1 199 $ pour le module seul, le calcul de valeur s'est compressé. Une RTX 4070 Super desktop usagée (12 Go) part à 500-600 $ en ce moment, pis les laptops Apple série M avec mémoire unifiée matchent encore ou battent ça sur le pur ajustement de modèle par dollar.

Pour les builders, deux takeaways. Premièrement, le côté GPU grand public de la bifurcation IA est maintenant visible : la prime mémoire des centres de données saigne dans le prix des laptops, pis le seuil 12 Go pour le travail LLM local est effectivement devenu une décision de composant à 1 200 $+ peu importe le vendeur. Si tu spécifies du matériel dev, pèse le chemin d'upgrade Framework (modulaire mais cher) contre le MacBook Pro série M (verrouillé mais moins cher par Go) pis les desktops workstation refurbis avec des 4090/3090 usagées — ces derniers sont encore les gagnants du ratio prix-VRAM. Deuxièmement, surveille si AMD ou Intel utilisent le parapluie de prix de Nvidia pour atterrir agressivement sur des cartes grand public 16 Go pis plus ; l'écart est plus large qu'il l'a été depuis des années, pis le segment laptop IA est vraiment contestable pour la première fois depuis 2024. Le retard du refresh « Super », c'est pas juste un problème Nvidia — c'est une ouverture pour tous les autres.