Google mise sur la pénurie de CPU avec un partenariat Intel au cœur du boom de l'inférence IA

Google Cloud et Intel ont élargi leur partenariat pluriannuel jeudi, approfondissant leur collaboration sur des unités de traitement d'infrastructure personnalisées (IPU) et s'engageant aux derniers processeurs Xeon 6 d'Intel pour les charges de travail d'inférence IA. L'entente, qui s'appuie sur un partenariat de développement de puces amorcé en 2021, se concentre sur des IPU personnalisées basées sur ASIC conçues pour décharger les tâches de centres de données des CPU — répondant à ce que le PDG d'Intel Lip-Bu Tan appelle le besoin de « systèmes équilibrés » au-delà des seuls accélérateurs.

Cette démarche souligne un virage stratégique qui se produit à travers l'industrie. Alors que les pénuries de GPU dominent les manchettes, la vraie crise d'infrastructure émerge autour des CPU nécessaires pour l'inférence IA à grande échelle. L'entraînement attire l'attention, mais l'inférence c'est là où les vraies affaires se passent — et c'est du travail qui demande beaucoup de CPU. SoftBank's Arm Holdings vient d'annoncer son premier CPU AGI autoproduit au milieu de cette « crise mondiale », signalant que les compagnies de puces voient la pénurie de CPU comme le prochain goulot d'étranglement majeur.

Ce qui est révélateur c'est comment ce partenariat s'inscrit dans la stratégie d'infrastructure plus large de Google. Les ententes récentes montrent Google Cloud courtisant agressivement les clients entreprise avec des partenariats IA — de l'intégration IA créative d'Adobe à la transformation télécom européenne de cinq ans de Liberty Global. Ce ne sont pas juste des contrats cloud; ce sont des paris que celui qui contrôle l'infrastructure d'inférence va contrôler le déploiement IA à l'échelle entreprise.

Pour les développeurs, ceci pointe vers une réalité pratique : commencez à planifier pour les contraintes de CPU dans vos applications IA. La pénurie de GPU nous a appris à optimiser pour l'efficacité d'entraînement, mais la crise de CPU qui s'en vient signifie repenser l'architecture d'inférence. Les IPU personnalisées et processeurs spécialisés ne sont plus juste des luxes d'entreprise — ils deviennent une infrastructure nécessaire pour tout déploiement IA sérieux.

Google mise sur la pénurie de CPU avec un partenariat Intel au cœur du boom de l'inférence IA

Plus de nouvelles