Blackstone 把 $50 亿股本投到一家新的、美国本土的合资公司里,跟 Google 一起,这家公司在 Google Cloud 现有平台之外、把 TPU compute 当成一项服务来卖。500 MW 2027 年上线,之后扩。Benjamin Treynor Sloss —— 那位把 SRE 作为一门学科系统化下来的 Google infra 老臣 —— 任 CEO。Google 出芯片(公告引用了 8 代:TPU 8t 训练、TPU 8i 推理)、软件,以及配套服务。JV 自己建、自己运营 data center。TPU 自从问世以来,这是第一次被有分量地从 GCP stack 里解耦出来。
Sloss 出任 CEO 是真正重要的运营信号。那位建了 Google SRE 和 production-reliability 计算方法学(现在所有人都在用的那一套)的人,现在去跑一家几十亿规模的 AI 基础设施 operator。这是 reliability-first 的ops CEO 任命,不是 financial-engineering 的占位人选。500 MW 2027 年,这个数字是有分量的 —— 作为参照,CoreWeave 2025 年的 GPU 占地大致是 800 MW,所以这家 venture 一上来就是 TPU-cloud-operator 的 scale,不是 boutique。结构上:Google 出芯片和 stack;Blackstone 出资本和 operator construct;JV 出 data-center 建设、networking、运营。
生态效应。这三年 AI infra cloud 的 playbook 是「买 NVIDIA GPU、建一个 cloud、卖 GPU-hour」—— CoreWeave、Lambda、Nebius、Crusoe、Yotta。Google 现在为 TPU 拿到了结构上对应的那一套。在今天之前,想要 TPU access 就意味着你得绑定 GCP 的整套 stack(BigQuery 邻近的 IAM、GKE、Cloud Storage、billing)。现在 TPU compute 可以作为 standalone 产品被买到。下游三个效应:Anthropic 作为最大 TPU 买家之一,拿到一个有分量的、非 GCP 的额外容量选项;那些之前想要 TPU 但不想被 GCP lock-in 的非 GCP 企业(hedge fund、quant shop、sovereign 部署)拿到一个 buyer;NVIDIA 那个「default AI compute」的位置被实打实、有资本撑腰地砍了一刀。AMD MI300/MI400 和 AWS Trainium 还都关在各自的云里 —— Google 这步结构性 move 把压力给到 AWS(对 Trainium 做类似的事)和 AMD(找个 JV partner,如果他们想在 operator 这一层、而不只是 silicon 这一层,真正跟人打)。
周一上手:如果你想要 TPU 跑生产负载,这家 venture 的 GA 时间表要盯紧 —— 2027 这个窗口正好跟 NVIDIA Rubin 上量是同一拨。本来就在 TPU 上跑得更顺的负载(dense transformer 的大 batch 训练、Gemini 风格架构的推理),成本曲线可能出现拐点 —— 第三方 operator 在历史上,价格通常比 captive-cloud 同机柜更狠。在 GPU 或者 TPU 上都跑得差不多的负载,面对的是个战略选择:押 Google 这一摊真能长成另一种compute substrate,还是留在更广的 NVIDIA stack 上。Sloss 这个任命,把「这家 venture 真能交付可靠容量」而不是「只是宣布一下」的概率往上抬了不少。接下来 6 个月该盯的名字:Sloss 自己招的人。他 ops 组的人员构成,会告诉你这是一个真正的 reliability-first operator,还是一个穿了运营外套的 balance-sheet 工具。
