AWS RNG:隨機圖拓撲,吞吐量+33%,網路設備減少50%

AWS詳述了Random Network Graph(RNG),一個自去年末一直在悄悄部署的資料中心網路拓撲,現已在愛爾蘭、德國和西班牙上線。數字:吞吐量提升33%,網路設備減少50%,估計節省數十億。結構性舉措是替換一直是hyperscale預設的fat-tree(Clos)拓撲。Fat-tree將伺服器間資料流約束到有限路徑,所以即使聚合頻寬充足congestion也會出現。RNG透過將一些光纖段以刻意模式放置、另一些隨機放置來增加可用路徑——這是學術工作(Jellyfish、expander-graph網路)論證了十多年的隨機拓撲思想的生產部署。研究論文在arXiv 2604.15261。

兩個工程部分使隨機拓撲實用,兩者都是對建構者有趣的部分。ShuffleBox是一個客製被動設備——不消耗電力——在RNG的隨機配置中物理交叉連接光纖電纜;無電源屬性重要,因為在資料中心規模,佈線層通常要麼是手動的(易錯)要麼是有電源的(另一個failure domain和功耗)。Spraypoint是客製路由協定:路由器向所有相鄰路由器「噴灑」流量,然後轉發資料包到目的地,這就是你如何利用眾多可用路徑而不引起任意mesh拓撲通常造成的路由表爆炸。組合——物理層的被動硬體,邏輯層的spray-routing——是將理論上漂亮的隨機圖變成在AWS規模可操作的東西。

生態系統解讀:隨機/expander資料中心拓撲多年來一直是研究寵兒,正是因為它們在每美元路徑多樣性上擊敗fat-tree,但它們在營運上很難——佈線複雜性和路由複雜性是阻礙。AWS用客製硬體加客製協定解決兩者,是理論現在在最大規模上production-viable的訊號。具體到AI訓練,即使AWS沒有明說,含義是直接的:all-reduce等集合操作是bandwidth-bound和congestion-sensitive的,所以更多非壅塞路徑正是大模型訓練fabric想要的——儘管公告沒有給出AI訓練特定數字,也沒有與NVIDIA InfiniBand或Google的Jupiter的head-to-head,這是該領域真正需要的比較。誠實的警告:「節省數十億」數字是AWS自己的估計,這是AWS內部基礎設施(不是你能買的產品,也不是你能建構的開放硬體),33%是聚合吞吐量聲明,沒有按工作負載分解。

如果你週一早上執行自己的資料中心fabric:arXiv論文(2604.15261)值得為ShuffleBox被動交叉連接和Spraypoint spray-routing設計而讀——即使硬體不可移植,思想是可移植的。如果你是在eu-west-1(愛爾蘭)或德國/西班牙區域執行訓練或大型分散式工作負載的AWS客戶:這是你無需更改任何東西就繼承的吞吐量和可靠性。結構性新聞是隨機圖資料中心拓撲從論文跨越到hyperscale生產——關注論文中的設計細節是被其他營運商採用還是仍是AWS護城河。

AWS RNG:隨機圖拓撲,吞吐量+33%,網路設備減少50%

更多新聞