Nvidia在一篇Game Ready驅動更新部落格貼文的末尾埋了一條公告:筆電版GeForce RTX 5070將獲得從8GB提升到12GB GDDR7的記憶體升級,提升50%。其他規格保持不變:仍是128位元記憶體介面、仍是4608個CUDA核心、仍是GB206矽晶片(Nvidia在桌面RTX 5060上用的同一顆,明顯弱於桌面5070上的GB205)。模組化筆電廠商Framework率先承諾,把新的12GB模組放進了升級版Framework Laptop 16。問題立刻浮現:獨立GPU模組的價格是1199美元,而8GB版本是699美元——同一顆晶片只是焊上更多記憶體,價格漲了71.5%。
價格才是這件事的核心,不是規格升級。Framework明確把帳算到了「我們看到的矽晶片供應商定價」上,並警告8GB模組的價格也很可能在當前GDDR7庫存耗盡後上漲。這就是資料中心記憶體緊缺向消費側的溢出——HBM和GDDR7產能已經被重新導向到超大規模廠商的AI建設上,把遊戲和準專業市場留下來,為本來是大宗品級容量的東西支付溢價。早前傳聞稱Nvidia原本規劃的RTX 50系「Super」中期刷新——本可全線升級記憶體——因同樣的原因被悄悄推遲或取消。這塊12GB行動版5070就是從縫隙裡擠出來的產物;一次單SKU升級,而非全代刷新。
對本地AI工作負載而言,8GB到12GB的躍遷是「勉強能用」和「大多數場景都行」之間的差別。8GB放不下FP16的Llama級8B模型,7B在int4下也沒給上下文留下任何餘量。12GB能舒服地放下FP16的7B模型並保持合理上下文長度,放下int4的13B並為KV快取留餘地,讓本地程式碼補全這種常見開發流程不必page-fault到RAM。這讓行動版5070成為對真正想做on-device推論的開發者來說最低檔但實際可用的筆電GPU——但單模組1199美元,價值算數已經被壓縮。一塊二手桌面RTX 4070 Super(12GB)現在500到600美元就能買到,搭配統一記憶體的Apple M系列筆電在「每美元能跑多大模型」這個指標上仍然持平甚至勝出。
對builder來說,有兩點收穫。第一,AI分化在消費級GPU側已經可見:資料中心記憶體溢價正在滲入筆電定價,本地LLM工作所需的12GB門檻已經實際上變成一個跨廠商都需1200美元+的零組件決策。如果你在配開發硬體,把Framework的升級路徑(模組化但貴)和Apple M系列MacBook Pro(封閉但每GB便宜)以及搭配二手4090/3090的翻新工作站桌機放一起比——後者仍是性價比之王。第二,關注AMD或Intel是否會借Nvidia的定價傘,激進推出16GB及以上的消費級顯卡;這個差距是多年來最大的一次,AI筆電細分市場自2024年以來第一次真正可爭。「Super」刷新的延後不只是Nvidia的問題——這是給其他人留出的口子。
