Nvidia anunció —enterrado al pie de un blog post de actualización del driver Game Ready— que la versión laptop de la GeForce RTX 5070 recibe un aumento de memoria de 8 GB a 12 GB de GDDR7, un incremento del 50 por ciento. Todo lo demás se mantiene idéntico: sigue siendo una interfaz de memoria de 128 bits, siguen siendo 4.608 núcleos CUDA, sigue siendo el die de silicio GB206 (el mismo que Nvidia usa para la RTX 5060 de escritorio, notablemente más débil que el GB205 en la 5070 de escritorio). Framework, el fabricante de laptops modulares, fue el primero en comprometerse, poniendo el nuevo módulo de 12 GB en un Framework Laptop 16 actualizado. El detalle salió de inmediato: el módulo GPU independiente cuesta USD 1.199 contra USD 699 por la versión de 8 GB —un aumento del 71,5 por ciento por lo que de otra forma es el mismo chip con más memoria soldada encima.
El precio es la historia, no el incremento de especificaciones. Framework culpó explícitamente a "los precios que estamos viendo de los proveedores de silicio" y advirtió que el precio del módulo de 8 GB también probablemente subirá una vez agotado el inventario actual de GDDR7. Esto es el desbordamiento del lado del consumidor del aprieto de memoria de los data centers —la producción de HBM y GDDR7 ha sido redirigida hacia las construcciones de IA de hyperscalers, dejando al mercado gaming y prosumer pagando precios de sobreprecio por lo que antes era capacidad commodity. Rumores anteriores sugerían que el refresh "Super" planeado para la serie RTX 50 —que habría aumentado la memoria en toda la línea— fue silenciosamente retrasado o cancelado por la misma razón. La 5070 móvil de 12 GB es lo que pasa por la grieta; un upgrade de SKU único en lugar de un refresh a nivel de generación.
Para cargas de IA local, el salto de 8 GB a 12 GB es la diferencia entre "apenas usable" y "funcional para la mayoría de cosas". 8 GB no podía meter modelos clase Llama 8B en FP16, y 7B en int4 no dejaba margen para contexto. 12 GB cómodamente mete 7B en FP16 con largo de contexto razonable, 13B en int4 con espacio para caché KV, y te deja correr flujos de desarrollo comunes como autocompletado de código local sin fallar a RAM. Eso hace que la 5070 móvil sea la GPU de laptop de gama más baja que es realmente viable para un desarrollador que quiere inferencia on-device significativa —pero a USD 1.199 por el módulo solo, la matemática de valor se ha comprimido. Una RTX 4070 Super de escritorio usada (12 GB) se consigue por USD 500-600 ahora mismo, y las laptops Apple serie M con memoria unificada todavía igualan o superan esto en pura adaptación de modelo por dólar.
Para constructores, dos lecturas. Primero, el lado de GPU de consumo de la bifurcación de IA ahora es visible: la prima de memoria del data center se está sangrando al precio de laptops, y el umbral de 12 GB para trabajo LLM local efectivamente se ha vuelto una decisión de componente de USD 1.200+ sin importar el proveedor. Si especificas hardware de desarrollo, pesa el camino de upgrade Framework (modular pero caro) contra MacBook Pro serie M (cerrado pero más barato por GB) y desktops workstation refurbished con 4090/3090 usadas —los últimos siguen siendo los ganadores en ratio precio-VRAM. Segundo, observa si AMD o Intel usan el paraguas de precio de Nvidia para aterrizar agresivamente en tarjetas de consumo de 16 GB y más; la brecha es más amplia que en años, y el segmento laptop de IA es genuinamente disputable por primera vez desde 2024. El retraso del refresh "Super" no es solo un problema de Nvidia —es una apertura para todos los demás.
