Astera Labs Scorpio:320 lanes PCIe 6/UALink/NVLink AI 集群 fabric

Astera Labs 今天揭幕 Scorpio X-Series,一個為 scale-up AI 計算集群構建的 memory-semantic 智慧 fabric 交換機。關鍵數字是每晶片 320 lanes 的 PCIe 6,同時支援 NVLink Fusion、UALink 和開放標準 fabrics。公司稱之為業界最大的開放 memory-semantic fabric 交換機 — 這個 framing 要緊,因為今天大多數 builder 跑的替代品是 NVIDIA 的專有 NVLink Switch,它一直是超越單個機架的訓練中 GPU-到-GPU 連接的事實標準。Scorpio 是 UALink 陣營的第一個商業化規模回應。

區分 Scorpio 的架構選擇是 memory-semantic 定址而非基於封包的。GPU 用 load/store 操作存取 fabric-attached 資源,就像它們到達本地 HBM 一樣 — 消除了在基於乙太網的 fabrics 上添加延遲的 packet-translation 開銷。Astera 把這個與專有「Hypercast」和 in-network compute 原語配對,這些原語直接在交換機矽上執行集合操作(all-reduce、all-gather、reduce-scatter — 分散式訓練的核心),而不是把資料透過 GPU 記憶體反彈。Claim 是 collectives 2 倍更快,如果成立,這是一種在多千 GPU 規模上改變訓練經濟學計算的數字。配套的 P-Series PCIe Fabric Switch 家族(32-320 lanes)處理前端網路和較小的 AI 計算系統部署。具體的埠數、總切分頻寬、每跳延遲以及對比 NVIDIA NVLink Switch 4 的競爭數字在發布報導中沒有 — 那些是接下來要緊的問題。

生態讀法是 UALink 聯盟剛剛獲得了一個旗艦矽產品。AMD、Intel、Broadcom、Cisco、Google、Meta、Microsoft 和其他在 2024-2025 支援 UALink 作為 NVLink 的開放標準回應,問題一直是誰為它提供生產級交換矽。Astera Labs 現在就是那個 vendor。對用 AMD MI300X/MI400 或 Intel Gaudi 或客製矽構建替代-NVIDIA 訓練集群的 neoclouds 和 hyperscalers,Scorpio 是缺失的部分 — 讓你能構建競爭力 scale-up 域而不必與 H100 一起買 NVLink Switches 的開放標準 memory-semantic fabric。對 NVIDIA,這在短期內不會取代 NVLink — Hopper/Blackwell 系統是 NVLink-native — 但物質上改變了護城河。買計算的客戶會越來越有一個可信的非-NVIDIA 棧,包括 fabric 層,這一直是 NVIDIA 在 GPU 本身之外獨特的架構 lock-in。

實際動作:如果你營運訓練基礎設施或 neocloud,Scorpio 的規格表值得為你的 Q3/Q4 硬體路線圖 review pull 出來。collectives 2 倍提速的 claim 需要在你的實際 workload 上驗證 — collectives 是 workload-依賴的,對密集 MoE 訓練 vs RecSys vs LLM 預訓練,增益會看起來不同。如果你是 AMD-shop 或在考慮 MI400-級部署,Scorpio 是你實際可以買的 fabric,讓你的 scale-up 域在原始 GPU-到-GPU 頻寬和延遲上與 NVIDIA NVLink-centric 集群競爭。如果你透過 providers 消費計算(大多數 builder),這間接重要:你的 provider 選擇的 fabric vendor 流向 per-GPU-hour 定價。看哪些 neoclouds 在接下來兩個季度採用 Scorpio;那就是 NVIDIA NVLink-Switch 稅的定價壓力開始顯現的地方。

Astera Labs Scorpio:320 lanes PCIe 6/UALink/NVLink AI 集群 fabric

更多新聞