Apple place un pari concentre sur une intelligence artificielle qui s'execute sur votre appareil plutot que dans un centre de donnees, et deux fils de ses annonces a la WWDC montrent a quel point la demarche est deliberee. L'un est un nouveau cadriciel pour developpeurs appele Core AI. L'autre est un detail plus discret sur la facon dont le prochain Siri utilise reellement Gemini de Google, et ensemble ils decrivent une entreprise qui cherche a posseder les modeles sur son materiel tout en empruntant celui d'un rival uniquement pour entrainer les siens.
Core AI est le successeur de Core ML, le cadriciel d'apprentissage automatique local de longue date d'Apple, et il est concu pour l'ere generative. Il permet aux applications de faire tourner de grands modeles de langage et de l'IA generative entierement en local, sans dependance a un serveur et sans couts de jetons, en prenant en charge a la fois des modeles PyTorch personnalises et des modeles open source preoptimises grace a une API Swift a memoire securisee. Apple affirme qu'il couvre un large eventail, depuis des modeles de vision compacts de 3 milliards de parametres jusqu'a de grands modeles de raisonnement allant jusqu'a 70 milliards de parametres, avec une compilation anticipee pour des temps de chargement instantanes et des optimisations d'IA generative comme la gestion du KV-cache, le decodage autoregressif et des noyaux Metal 4 concus specialement pour l'attention. Il fonctionne sur iPhone, iPad, Mac et Apple Vision Pro, est livre des maintenant dans la beta de Xcode 27 pour les developpeurs, et est attendu dans les versions de production cet automne.
Le detail au sujet de Siri est plus subtil et, a certains egards, plus revelateur. Selon une analyse de ce que la presentation a laisse non dit, Apple utilise Gemini comme un professeur plutot que comme un moteur. Gemini genere des donnees d'entrainement et des signaux d'apprentissage qui sont distilles dans les propres Foundation Models de troisieme generation d'Apple, une etape qui se produit une seule fois durant le developpement, tandis que les modeles qui repondent reellement a vos requetes tournent sur l'appareil. Gemini n'est joint dans le cloud que comme solution de repli, pour la minorite de requetes qui depassent ce que le modele local peut traiter.
Cette distinction est tout l'enjeu. Un professeur au moment de l'entrainement est une dependance ponctuelle et reversible, le genre qu'Apple pourrait remplacer ou abandonner progressivement plus tard, tandis qu'un moteur au moment de l'execution serait un verrouillage structurel qui touche la confidentialite, la latence et le cout de chaque requete. Lue ainsi, l'affirmation selon laquelle Apple depend desormais de Gemini exagere les choses: c'est une hierarchie de concessions plutot qu'une capitulation, Apple gardant la partie qui compte le plus, l'inference locale sur ses propres modeles, et ne cedant qu'une solution de repli dans le cloud. L'arrangement vient sans chiffres divulgues, meme si The Information a rapporte, sans qu'Apple le confirme, qu'une partie de cette inference dans le cloud pourrait tourner sur des puces Nvidia B200 a l'interieur des centres de donnees de Google.
La raison pour laquelle cela vaut la peine d'etre suivi tient a la direction que cela indique. Faire tourner localement des modeles de quelques milliards de parametres jusqu'a 70 milliards, a cout de jetons nul, et les entrainer en distillant le savoir de plus grands modeles de pointe, est l'un des paris les plus lourds de consequences en IA en ce moment, parce qu'il ramene la capacite sur l'appareil et hors du cloud facture a l'usage. Apple a le silicium et l'echelle pour le pousser plus loin que presque quiconque. Les reserves honnetes sont que la production n'arrive pas avant l'automne, que la performance en conditions reelles des grands modeles locaux est la question ouverte, et que professeur-pas-moteur est en partie le cadrage d'Apple elle-meme pour une relation qu'elle prefererait minimiser. Mais des modeles possedes et locaux entraines par distillation, c'est exactement la direction vers laquelle se dirige une grande partie du travail interessant, et Apple vient de donner aux developpeurs le cadriciel pour construire dessus.
