Apple, किसी डेटा सेंटर के बजाय आपके डिवाइस पर चलने वाली कृत्रिम बुद्धिमत्ता पर एक केंद्रित दांव लगा रहा है, और उसकी WWDC घोषणाओं से जुड़े दो सूत्र दिखाते हैं कि यह कितना सुविचारित है। एक है Core AI नामक एक नया डेवलपर फ्रेमवर्क। दूसरा एक शांत विवरण है कि अगला Siri वास्तव में Google के Gemini का उपयोग कैसे करता है, और मिलकर ये एक ऐसी कंपनी का वर्णन करते हैं जो अपने हार्डवेयर पर चलने वाले मॉडलों का स्वामित्व चाहती है, और एक प्रतिद्वंद्वी का मॉडल केवल अपने स्वयं के मॉडल को सिखाने के लिए उधार लेती है।
Core AI, Apple के लंबे समय से चले आ रहे ऑन-डिवाइस मशीन-लर्निंग फ्रेमवर्क Core ML का उत्तराधिकारी है, और यह जनरेटिव युग के लिए बनाया गया है। यह ऐप्स को बड़े भाषा मॉडल और जनरेटिव AI को पूरी तरह ऑन-डिवाइस चलाने देता है, बिना किसी सर्वर निर्भरता के और बिना किसी टोकन लागत के, और एक मेमोरी-सुरक्षित Swift API के माध्यम से कस्टम PyTorch मॉडल और पहले से ऑप्टिमाइज़ किए गए ओपन-सोर्स मॉडल दोनों का समर्थन करता है। Apple का कहना है कि यह एक विस्तृत श्रेणी को कवर करता है, कॉम्पैक्ट 3 अरब पैरामीटर विज़न मॉडल से लेकर 70 अरब पैरामीटर तक के बड़े रीज़निंग मॉडल तक, तुरंत लोड होने के समय के लिए अहेड-ऑफ-टाइम संकलन और KV-cache प्रबंधन, ऑटोरिग्रेसिव डिकोडिंग, तथा अटेंशन के लिए विशेष रूप से बनाए गए Metal 4 कर्नेल जैसी जनरेटिव-AI ऑप्टिमाइज़ेशन के साथ। यह iPhone, iPad, Mac और Apple Vision Pro पर चलता है, अभी डेवलपर्स के लिए Xcode 27 बीटा में उपलब्ध है, और पतझड़ में प्रोडक्शन रिलीज़ में आने वाला है।
Siri का विवरण अधिक सूक्ष्म है और, कुछ मायनों में, अधिक खुलासा करने वाला है। कीनोट ने जो अनकहा छोड़ा उसके एक विश्लेषण के अनुसार, Apple, Gemini का उपयोग एक इंजन के बजाय एक शिक्षक के रूप में करता है। Gemini प्रशिक्षण डेटा और सीखने के संकेत उत्पन्न करता है जिन्हें Apple के अपने तीसरी पीढ़ी के Foundation Models में आसवित किया जाता है, एक ऐसा चरण जो विकास के दौरान एक बार होता है, जबकि जो मॉडल वास्तव में आपके अनुरोधों का उत्तर देते हैं वे डिवाइस पर चलते हैं। Gemini तक क्लाउड में केवल फॉलबैक के रूप में पहुँचा जाता है, उन अल्पसंख्यक अनुरोधों के लिए जो ऑन-डिवाइस मॉडल की क्षमता से अधिक हों।
यही अंतर पूरा मुद्दा है। एक प्रशिक्षण-समय का शिक्षक एक बार की और प्रतिवर्ती निर्भरता है, जिस तरह की निर्भरता Apple बाद में बदल सकता है या छोड़ सकता है, जबकि एक रनटाइम इंजन एक संरचनात्मक लॉक-इन होता जो गोपनीयता, लेटेंसी, और हर एक क्वेरी की लागत को छूता है। इस तरह पढ़ें तो, यह सुर्खी कि Apple अब Gemini पर निर्भर है, बात को बढ़ा-चढ़ाकर पेश करती है: यह आत्मसमर्पण के बजाय रियायतों का एक पदानुक्रम है, जिसमें Apple सबसे महत्वपूर्ण हिस्से को रखता है, यानी अपने स्वयं के मॉडलों पर ऑन-डिवाइस इन्फरेंस, और केवल एक क्लाउड फॉलबैक छोड़ता है। यह व्यवस्था किसी प्रकट किए गए आँकड़ों के बिना आती है, हालाँकि The Information ने रिपोर्ट किया है, बिना Apple की पुष्टि के, कि उस क्लाउड इन्फरेंस का कुछ हिस्सा Google के डेटा सेंटरों के भीतर Nvidia B200 चिप्स पर चल सकता है।
यह क्यों देखने लायक है, इसका कारण वह दिशा है जिसकी ओर यह इशारा करती है। कुछ अरब पैरामीटर से लेकर 70 अरब तक के मॉडलों को स्थानीय रूप से, शून्य टोकन लागत पर चलाना, और बड़े अग्रणी मॉडलों से ज्ञान आसवित करके उन्हें प्रशिक्षित करना, अभी AI में सबसे परिणामकारी दांवों में से एक है, क्योंकि यह क्षमता को मीटर वाले क्लाउड से बाहर खींचकर वापस डिवाइस पर ले आता है। Apple के पास इसे लगभग किसी से भी आगे ले जाने के लिए सिलिकॉन और पैमाना है। ईमानदार चेतावनियाँ यह हैं कि प्रोडक्शन पतझड़ तक नहीं आता, बड़े ऑन-डिवाइस मॉडलों का वास्तविक-दुनिया का प्रदर्शन एक खुला प्रश्न है, और शिक्षक-न-कि-इंजन आंशिक रूप से Apple का अपना ढाँचा है उस रिश्ते का जिसे वह कम करके दिखाना पसंद करेगा। लेकिन आसवन द्वारा सिखाए गए स्वामित्व वाले, ऑन-डिवाइस मॉडल ठीक वही दिशा है जहाँ बहुत सारा रोचक काम बढ़ रहा है, और Apple ने अभी डेवलपर्स को उस पर निर्माण करने के लिए फ्रेमवर्क दे दिया है।
