NVIDIA ने पिछले कुछ वर्षों में सबको यही सिखाया कि GPU ही कंप्यूटर है, इसलिए यह ध्यान देने लायक है कि उसका नवीनतम प्रस्ताव एक CPU है। इस हफ़्ते घोषित Vera को कंपनी AI एजेंटों के लिए ख़ासतौर पर बना अपना पहला processor कहती है, और वह इस फ़्रेमिंग में हिचकती नहीं: यह कोई CPU अपग्रेड नहीं, एक नई श्रेणी है। यह Vera Rubin प्लेटफ़ॉर्म और Vera BlueField-4 STX storage processors के host processor के रूप में काम करता है, और मुख्य कार्यकारी Jensen Huang की इससे जुड़ी पंक्ति एक वाक्य में पूरी थीसिस है: 'AI एजेंट computing के सबसे बड़े उपयोगकर्ता होंगे। Vera उस भविष्य के लिए डिज़ाइन किया गया पहला CPU है, जिसे असाधारण performance, efficiency और programmability के साथ hyperscale पर agentic AI चलाने के लिए बनाया गया है।'
विनिर्देश उसी दावे की ओर लक्षित हैं। Vera में 88 कस्टम Olympus cores हैं, off-the-shelf Arm या x86 डिज़ाइनों के बजाय NVIDIA की अपनी CPU architecture, जो एक LPDDR5X मेमोरी सबसिस्टम के साथ जोड़ी गई है जिसकी bandwidth 1.2TB/s तक आँकी गई है। एक दूसरी पीढ़ी का NVLink-C2C interconnect CPU और GPU के बीच 1.8TB/s तक coherent bandwidth देता है, और यही वह आँकड़ा है जो एजेंट की कहानी के लिए सबसे ज़्यादा मायने रखता है, क्योंकि यह तय करता है कि host कितनी तेज़ी से accelerator को काम भेज सकता है, बिना दोनों हिस्सों के तालमेल से बाहर हुए।
जिस वजह से एक CPU को इतना बड़ा लॉन्च मिलता है, वह agentic काम का स्वरूप है। जब कोई मॉडल बस एक सवाल का जवाब देता है, तब लगभग सब कुछ GPU करता है। जब कोई एजेंट काम करता है, तो वह code चलाता है, tools को बुलाता है, नतीजों का मूल्यांकन करता है, और बड़ी संख्या में समवर्ती environments और queries संभालता है, और यह orchestration CPU-bound है। NVIDIA का तर्क यह है कि जैसे-जैसे यह प्रमुख workload बनता जाएगा, एक ऐसा host processor जो साथ न चल पाए, महँगे accelerators को बेकार बैठा छोड़ देता है, इसलिए CPU अचानक फिर से critical path पर आ जाता है। Vera को उस हिस्से के रूप में पेश किया गया है जो accelerators को चलते रखता है।
ईमानदार पढ़ाई के लिए दो चेतावनियाँ चाहिए। performance का दावा, task completion में 1.8x तेज़ी, x86 CPUs के मुक़ाबले code compilation, Python, Java और database processing पर Phoronix benchmarks का इस्तेमाल करके मापा गया है, न कि NVIDIA के अपने पिछले Grace CPU के मुक़ाबले, इसलिए यह श्रेणी के बारे में ज़्यादा बताता है, पीढ़ीगत बढ़त के बारे में कम। और सिस्टम 2026 की शरद ऋतु तक नहीं आते, Dell, HPE, Lenovo, Supermicro और cloud पार्टनरों से, जो इसे एक product जितना ही एक roadmap का बयान बना देता है। पर दिलचस्प हिस्सा दिशा है: एजेंट का युग ध्यान को वापस उस बेरौनक host processor की ओर खींच रहा है, और जो कंपनी सबसे ज़्यादा GPU से जुड़ी है, वह अब CPU को एजेंटों के लिए बनी चीज़ के रूप में बेच रही है।
