OpenAI और Broadcom ने Jalapeno का अनावरण किया है, जो OpenAI की पहली कस्टम AI चिप है, एक ऐसा एक्सेलरेटर जिसे खास तौर पर बड़े भाषा मॉडल को प्रशिक्षित करने के बजाय उन्हें चलाने के लिए बनाया गया है। दोनों कंपनियों ने इस घोषणा की पुष्टि की और इसे एक बहु-पीढ़ी कंप्यूट प्लेटफॉर्म के पहले कदम के रूप में पेश किया जिसे दोनों मिलकर बना रहे हैं। ऐसी चिप का मकसद सीमित लेकिन अहम है: इन्फरेंस, यानी किसी प्रॉम्प्ट का असल में जवाब देने का काम, वहीं है जहां एक मॉडल के तैनात हो जाने के बाद ज़्यादातर खर्च छुपा होता है, और सिर्फ़ उसी काम के लिए ट्यून की गई चिप एक सामान्य-उद्देश्य वाले GPU से इसे सस्ते में कर सकती है।
सबसे आकर्षक बात यह है कि यह कितनी तेज़ी से तैयार हुई। OpenAI और Broadcom का कहना है कि वे शुरुआती डिज़ाइन से मैन्युफैक्चरिंग टेप-आउट तक लगभग नौ महीने में पहुंच गए, जिसे वे इस तरह की उच्च-प्रदर्शन वाली चिप के लिए संभवतः अब तक हासिल किया गया सबसे तेज़ विकास चक्र बताते हैं। OpenAI के अनुसार, इस रफ्तार को संभव बनाने वाली एक वजह यह थी कि कंपनी ने डिज़ाइन और ऑप्टिमाइज़ेशन प्रक्रिया के कुछ हिस्सों को तेज़ करने के लिए अपने खुद के मॉडल इस्तेमाल किए। यह अपने आप में एक चुपके से उल्लेखनीय दावा है: एक AI लैब अपने मौजूदा मॉडल का इस्तेमाल वह हार्डवेयर बनाने में मदद के लिए कर रही है जो उसके अगले मॉडल चलाएगा।
तकनीकी पक्ष पर, यह आर्किटेक्चर उसी चीज़ को निशाना बनाता है जो असल में इन्फरेंस प्रदर्शन को सीमित करती है, यानी कच्चे कंप्यूट के बजाय डेटा को इधर-उधर ले जाना। Jalapeno को इस तरह डिज़ाइन किया गया है कि वह उस डेटा मूवमेंट को कम करे और कंप्यूट, मेमोरी तथा नेटवर्किंग के बीच संतुलन बनाए ताकि वास्तविक उपयोग सैद्धांतिक चरम के कहीं ज़्यादा करीब बैठे, जहां ज़्यादातर चिप काफी पीछे रह जाती हैं। शुरुआती परीक्षण, जो फिर से खुद OpenAI के हैं, बताते हैं कि प्रति वाट प्रदर्शन मौजूदा अत्याधुनिक स्तर से काफी बेहतर है। योजना 2026 के अंत तक शुरुआती तैनाती और उसके बाद के वर्षों में विस्तार की है, और खबरों के अनुसार Microsoft उत्पादन का लगभग 40 प्रतिशत हिस्सा लेने के लिए तैयार है।
इसके मायने एक चिप से कहीं आगे जाते हैं। AI पर Nvidia की पकड़ उन GPU को बेचने पर टिकी रही है जिन पर लगभग हर कोई मॉडल प्रशिक्षित और चलाता है, और ऐसे मार्जिन पर कि हर सेवा दिया गया टोकन ऊपर की ओर एक भुगतान बन जाता है। Google ने अपने TPU बनाए और Amazon ने Trainium तथा Inferentia ठीक इसी वजह से बनाए: OpenAI के पैमाने पर, अपना खुद का सिलिकॉन डिज़ाइन करना हमेशा के लिए किसी और का किराये पर लेने से सस्ता है। Jalapeno के साथ OpenAI उसी क्लब में शामिल हो रहा है, यह अपने उत्पादों के नीचे के स्टैक का ज़्यादा हिस्सा खुद के पास रखने की एक कोशिश है ताकि बुद्धिमत्ता परोसने की लागत कम हो और वह किसी एक आपूर्तिकर्ता पर कम निर्भर रहे।
ईमानदार आकलन अपनी सीमाओं के साथ आता है। यह एक इन्फरेंस एक्सेलरेटर है, ट्रेनिंग चिप नहीं, इसलिए यह पाइपलाइन के उस हिस्से को नहीं छूती जहां Nvidia सबसे गहराई से जमा हुआ है। प्रदर्शन के आंकड़े खुद OpenAI के हैं और किसी स्वतंत्र पक्ष द्वारा परखे नहीं गए हैं, चिप अभी बड़े पैमाने पर नहीं चल रही है, और कस्टम सिलिकॉन का एक लंबा इतिहास रहा है कि वह स्लाइड पर डेटा सेंटर के मुकाबले बेहतर दिखता है। लेकिन नौ महीने की समयरेखा, एक नामित हाइपरस्केलर खरीदार और एक स्पष्ट रणनीतिक मकसद का यह मेल इस संकेत को नज़रअंदाज़ करना मुश्किल बना देता है। जो कंपनियां अपनी खुद की चिप बनाने का खर्च उठा सकती हैं, वे ऐसा कर रही हैं, और AI में कौन किसे भुगतान करता है इसका अर्थशास्त्र बदलना शुरू हो गया है।
