Google s'est engagé à déployer plusieurs générations futures des processeurs Xeon d'Intel dans son infrastructure cloud, marquant un vote de confiance significatif dans l'infrastructure IA centrée sur les CPU. Ce partenariat pluriannuel s'étend au-delà de l'utilisation actuelle par Google Cloud des processeurs Xeon 6 d'Intel dans les instances C4 et N4 pour inclure le co-développement personnalisé d'unités de traitement d'infrastructure (IPU) basées sur ASIC. L'action d'Intel a bondi de 4,7% suite à l'annonce, suggérant que Wall Street y voit une validation de la stratégie IA d'Intel au-delà de la simple fabrication.
Cet accord souligne un changement critique dans la réflexion sur l'infrastructure IA. Alors que l'industrie est obsédée par les pénuries de GPU et les puces d'entraînement, le déploiement réel des systèmes d'IA nécessite une orchestration massive de CPU pour le traitement des données, la coordination des modèles et la gestion système. Le commentaire du CEO d'Intel Lip-Bu Tan que "l'IA ne fonctionne pas seulement avec des accélérateurs—elle fonctionne avec des systèmes" perce à travers le battage médiatique des GPU pour aborder ce qui maintient réellement les charges de travail IA en production. L'engagement de Google couvre plusieurs générations de processeurs, indiquant qu'ils planifient un avenir centré sur les CPU même pendant que les concurrents courent après des accélérateurs exotiques.
La partie co-développement IPU, qui a commencé en 2021, révèle la collaboration technique plus profonde ici. Ces puces personnalisées déchargent des tâches spécifiques de centre de données des CPU, créant des piles d'infrastructure IA plus efficaces. Intel a refusé de partager les détails de prix, mais l'engagement pluriannuel suggère que ce n'est pas juste une question d'approvisionnement—c'est concevoir conjointement la prochaine génération d'infrastructure de déploiement IA. Pour les développeurs qui construisent des systèmes IA de production, ce partenariat signale que l'optimisation CPU et l'informatique hétérogène importeront plus que la puissance brute des GPU pour la plupart des applications du monde réel.
