OpenAI का कहना है कि उसका GPT-5.5 Instant मॉडल अब स्वास्थ्य संबंधी सवालों के जवाब लगभग उतने ही अच्छे ढंग से देता है जितने अच्छे कंपनी के अग्रणी Thinking मॉडल देते हैं, और यह कि उसके अपने मूल्यांकनों में मॉडल के जवाबों को सटीकता, संप्रेषण और पूर्णता के मामले में चिकित्सकों द्वारा लिखे गए जवाबों से ज़्यादा अंक दिए गए। यह अपडेट सभी ChatGPT उपयोगकर्ताओं के लिए जारी हो रहा है, जिसमें मुफ़्त स्तर भी शामिल है, और यही वह हिस्सा है जो इसे उल्लेखनीय बनाता है: GPT-5.5 Instant वही तेज़, डिफ़ॉल्ट मॉडल है जो ज़्यादातर लोगों को मिलता है, न कि उन धीमे reasoning मॉडलों में से कोई जो भुगतान करने वाले उपयोगकर्ताओं के लिए आरक्षित हैं।
इसकी पहुँच ही वह वजह है जिससे यह मायने रखता है। OpenAI का कहना है कि हर हफ़्ते 23 करोड़ से ज़्यादा लोग स्वास्थ्य और तंदुरुस्ती के सवालों के साथ ChatGPT की ओर रुख करते हैं, इसलिए उस मॉडल को बेहतर बनाना जो डिफ़ॉल्ट रूप से इनमें से ज़्यादातर सवालों को संभालता है, उतने कहीं ज़्यादा लोगों को छूता है जितने किसी प्रीमियम स्तर पर हुई बढ़त छूती। कंपनी का कहना है कि नया संस्करण यह पहचानने में बेहतर है कि कब किसी स्थिति में तत्काल देखभाल की ज़रूरत पड़ सकती है, जवाब देने से पहले प्रासंगिक संदर्भ माँगने में, यह समझाने में कि वह कितना आश्वस्त या अनिश्चित है, और घनी चिकित्सकीय जानकारी को सरल भाषा में बदलने में। यह यह भी कहती है कि दो महीनों के काम में गलत स्वास्थ्य कथन लगभग 71 प्रतिशत घट गए।
मापन के पक्ष में, OpenAI स्वास्थ्य मूल्यांकनों के एक समुच्चय की ओर इशारा करता है, जिसमें एक बेंचमार्क भी शामिल है जिसे वह HealthBench Professional कहता है, जिस पर उसका कहना है कि GPT-5.5 Instant उसके अग्रणी reasoning मॉडलों के तुलनीय स्तर तक पहुँचता है। कंपनी 60 देशों में फैले 260 से ज़्यादा चिकित्सकों के एक वैश्विक नेटवर्क का भी वर्णन करती है, जो यह परिभाषित करने और आँकने में मदद करते हैं कि एक अच्छा स्वास्थ्य जवाब कैसा दिखता है, और यही वह तरह की विशेषज्ञ समीक्षा है जिसने वह प्रमुख दावा पैदा किया कि मॉडल ने डॉक्टरों के अपने लिखे जवाबों से ज़्यादा अंक पाए।
चेतावनियाँ बराबर का स्थान पाने की हकदार हैं। इन नतीजों में से हर एक OpenAI के अपने ही बेंचमार्क और उसके अपने ही समीक्षकों से आता है, जिनके साथ कोई स्वतंत्र या peer-reviewed सत्यापन जारी नहीं किया गया। किसी रेटिंग वाले अध्ययन में चिकित्सक द्वारा लिखे गए जवाबों से ज़्यादा अंक पाना एक पैनल द्वारा आँके गए किसी पाठ की गुणवत्ता को मापता है; यह उस बात को मापने के समान नहीं है कि जब कोई असली व्यक्ति उस सलाह पर अमल करता है तो क्या होता है, और तुलना की ठीक-ठीक व्यवस्था, जिसमें यह भी शामिल है कि क्या मॉडल और डॉक्टरों ने एक ही स्तर के विस्तार पर एक जैसे प्रॉम्प्टों के जवाब दिए, पूरी तरह स्पष्ट नहीं की गई है। यह सीधी-सी बात भी है कि यह वह तेज़ मॉडल है, न कि सोच-समझकर काम करने वाला मॉडल, जो अब डिफ़ॉल्ट रूप से करोड़ों मुफ़्त उपयोगकर्ताओं के स्वास्थ्य संबंधी सवालों को संभाल रहा है। OpenAI अब भी कहता है कि ChatGPT पेशेवर देखभाल का विकल्प नहीं है।
यह एक ऐसे हफ़्ते के अंत में आता है जो चिकित्सकीय-AI के दावों से भरा रहा, एक अप्रमाणित फुल-बॉडी स्कैनर से लेकर एक ठोस, peer-reviewed नतीजे तक जहाँ OpenAI के o3 ने Boston Children's Hospital में दुर्लभ बीमारियों के निदान में मदद की। यह कहीं इन दोनों के बीच में बैठता है: एक ऐसी क्षमता में बढ़त जो शायद असली है और उन रोज़मर्रा के सवालों के लिए सचमुच उपयोगी है जो लोग पहले से ही पूछ रहे हैं, पर एक ऐसे विपणन दावे में लिपटी है जिसे किसी कंपनी को अपने ही उत्पाद के बारे में तय करने का हक नहीं मिलना चाहिए। हर हफ़्ते 23 करोड़ लोगों के लिए बेहतर स्वास्थ्य जवाब एक असली भलाई है। किसी विक्रेता का अपने ही मॉडल को डॉक्टरों से ऊपर आँकना एक ऐसा दावा है जिसे तब तक एक दावे की तरह ही मानते रहना चाहिए जब तक कंपनी के बाहर का कोई इसकी जाँच न कर ले।
