Alibaba rejoint la Fondation PyTorch en Platine, contribue à vLLM et SGLang

Alibaba Cloud a rejoint la Fondation PyTorch comme membre Platine le 27 mai, le tier de gouvernance le plus haut aux côtés d'AMD, AWS, Google, Huawei, Meta, Microsoft et NVIDIA. Le titre, c'est le logo. Ce qui compte pour les bâtisseurs, c'est ce qu'Alibaba s'engage à pousser amont : contributions à vLLM et SGLang, travail de compatibilité multi-puces, optimisation du compilateur AI.

Alibaba fait rouler PyTorch à l'échelle production sur du hardware hétérogène pis maintient une distribution PyTorch custom qui suit l'upstream avec des optimisations pour le support multi-puces et les charges large échelle. Leurs engagements à ce tier : expérience out-of-the-box à travers les accélérateurs, optimisation du compilateur AI, compatibilité multi-puces, stabilité à large échelle. Leurs contributions existantes nommées dans l'annonce incluent PAI-TurboX, TorchEasyRec, pis du travail amont sur vLLM et SGLang. Les domaines de production couvrent l'entraînement et l'inférence LLM, la conduite autonome, l'IA incarnée, et les systèmes de recommandation.

Le shift d'écosystème se trouve en-dessous de l'annonce. Le support hardware de PyTorch a été NVIDIA-first depuis le début, les backends non-NVIDIA portant une énergie « best effort ». Ajouter un siège Platine à un cloud chinois dont le business case est le silicium hétérogène — parce que les clouds chinois ne peuvent pas acquérir des H100 et H200 de façon fiable — change la gravité. Le support multi-puces arrête d'être side-channel pis devient mainline financé en Platine. Effet de bord pour la couche d'inférence : vLLM et SGLang, les deux moteurs ouverts que quiconque sert des LLM à l'échelle a touchés, gagnent un mainteneur aux poches profondes dont les priorités ne sont pas NVIDIA-only.

Si tu bâtis de l'infra d'inférence sur vLLM ou SGLang pis tu considères des puces non-NVIDIA, le support au niveau framework va s'améliorer plus vite. Si tu paries que les features NVIDIA-only de PyTorch vont rester first-class, surveille les métadonnées de contribution sur les deux prochains trimestres. C'est là que le push multi-puces va apparaître en premier.

Alibaba rejoint la Fondation PyTorch en Platine, contribue à vLLM et SGLang

Plus de nouvelles