NVIDIA 過去幾年一直在教所有人 GPU 就是電腦,因此其最新的賣點竟是一款 CPU,格外引人注目。本週發表的 Vera,被該公司稱為首款專為 AI 代理打造的處理器,而它對這個定位毫不掩飾:這不是 CPU 升級,而是一個全新類別。它作為 Vera Rubin 平台與 Vera BlueField-4 STX 儲存處理器的主處理器,而附在其上、來自執行長黃仁勳的引言,正是一句話道盡的核心論點:「AI 代理將成為運算的最大用戶。Vera 是首款為那個未來設計的 CPU,打造目的是以超大規模執行代理式 AI,並具備非凡的效能、效率與可程式性。」
這些規格都瞄準著那項主張。Vera 搭載 88 個客製化 Olympus 核心,採用 NVIDIA 自家的 CPU 架構,而非現成的 Arm 或 x86 設計,並搭配頻寬額定高達 1.2TB/s 的 LPDDR5X 記憶體子系統。第二代 NVLink-C2C 互連在 CPU 與 GPU 之間提供高達 1.8TB/s 的一致性頻寬,這正是對代理這個故事最關鍵的數字,因為它決定了主處理器能多快將工作餵給加速器,而不致讓兩端步調脫節。
CPU 之所以能獲得壓軸發表,原因在於代理式工作的型態。當模型只是回答一個問題時,幾乎一切都由 GPU 完成。當代理採取行動時,它要執行程式碼、呼叫工具、評估結果,並管理大量並行的環境與查詢,而這種協調是受 CPU 制約的。NVIDIA 的論點是,當這成為主流工作負載時,一個跟不上的主處理器會讓昂貴的加速器閒置,因此 CPU 突然又回到了關鍵路徑上。Vera 被定位為讓加速器持續運轉的那個元件。
誠實的解讀需要兩項但書。那項效能主張,即任務完成速度快 1.8x,是以 Phoronix 在程式碼編譯、Python、Java 與資料庫處理上的基準測試,對比 x86 CPU 所測得,而非對比 NVIDIA 自家先前的 Grace CPU,因此它說的更多是關於這個類別,而非世代間的進步。而且這些系統要到 2026年秋 才會出貨,由 Dell、HPE、Lenovo、Supermicro 及雲端夥伴供應,這使它既是一項產品,也同樣是一份路線圖宣示。但有趣的部分在於方向:代理時代正把注意力拉回到不起眼的主處理器身上,而這家最常與 GPU 連結在一起的公司,如今正把 CPU 當作為代理打造的東西來銷售。
