Blackstone 把 $50 億股本投到一家新的、美國本土的合資公司裡,跟 Google 一起,這家公司在 Google Cloud 現有平台之外、把 TPU compute 當成一項服務來賣。500 MW 2027 年上線,之後擴。Benjamin Treynor Sloss —— 那位把 SRE 作為一門學科系統化下來的 Google infra 老臣 —— 任 CEO。Google 出晶片(公告引用了 8 代:TPU 8t 訓練、TPU 8i 推論)、軟體,以及配套服務。JV 自己建、自己營運 data center。TPU 自從問世以來,這是第一次被有分量地從 GCP stack 裡解耦出來。

Sloss 出任 CEO 是真正重要的營運訊號。那位建了 Google SRE 和 production-reliability 計算方法學(現在所有人都在用的那一套)的人,現在去跑一家幾十億規模的 AI 基礎設施 operator。這是 reliability-first 的ops CEO 任命,不是 financial-engineering 的佔位人選。500 MW 2027 年,這個數字是有分量的 —— 作為參照,CoreWeave 2025 年的 GPU 佔地大致是 800 MW,所以這家 venture 一上來就是 TPU-cloud-operator 的 scale,不是 boutique。結構上:Google 出晶片和 stack;Blackstone 出資本和 operator construct;JV 出 data-center 建設、networking、營運。

生態效應。這三年 AI infra cloud 的 playbook 是「買 NVIDIA GPU、建一個 cloud、賣 GPU-hour」—— CoreWeave、Lambda、Nebius、Crusoe、Yotta。Google 現在為 TPU 拿到了結構上對應的那一套。在今天之前,想要 TPU access 就意味著你得綁定 GCP 的整套 stack(BigQuery 鄰近的 IAM、GKE、Cloud Storage、billing)。現在 TPU compute 可以作為 standalone 產品被買到。下游三個效應:Anthropic 作為最大 TPU 買家之一,拿到一個有分量的、非 GCP 的額外容量選項;那些之前想要 TPU 但不想被 GCP lock-in 的非 GCP 企業(hedge fund、quant shop、sovereign 部署)拿到一個 buyer;NVIDIA 那個「default AI compute」的位置被實打實、有資本撐腰地砍了一刀。AMD MI300/MI400 和 AWS Trainium 還都關在各自的雲裡 —— Google 這步結構性 move 把壓力給到 AWS(對 Trainium 做類似的事)和 AMD(找個 JV partner,如果他們想在 operator 這一層、而不只是 silicon 這一層,真正跟人打)。

週一上手:如果你想要 TPU 跑生產負載,這家 venture 的 GA 時間表要盯緊 —— 2027 這個窗口正好跟 NVIDIA Rubin 上量是同一撥。本來就在 TPU 上跑得更順的負載(dense transformer 的大 batch 訓練、Gemini 風格架構的推論),成本曲線可能出現拐點 —— 第三方 operator 在歷史上,價格通常比 captive-cloud 同機櫃更狠。在 GPU 或者 TPU 上都跑得差不多的負載,面對的是個戰略選擇:押 Google 這一攤真能長成另一種compute substrate,還是留在更廣的 NVIDIA stack 上。Sloss 這個任命,把「這家 venture 真能交付可靠容量」而不是「只是宣布一下」的機率往上抬了不少。接下來 6 個月該盯的名字:Sloss 自己招的人。他 ops 組的人員構成,會告訴你這是一個真正的 reliability-first operator,還是一個穿了營運外套的 balance-sheet 工具。