व्हाइट हाउस के विज्ञान और प्रौद्योगिकी नीति कार्यालय (OSTP) ने गुरुवार को एक मेमो जारी किया जिसमें चीन स्थित संस्थाओं पर अमेरिकी फ्रंटियर AI मॉडल क्षमताओं को चुराने के लिए औद्योगिक-पैमाने के अभियान चलाने का आरोप लगाया। निदेशक Michael Kratsios ने डिस्टिलेशन को प्राथमिक तकनीक के रूप में नामित किया, आरोप लगाया कि दसियों हज़ार प्रॉक्सी खाते और जेलब्रेक प्रॉम्प्ट अमेरिकी प्रयोगशालाओं से मालिकाना आउटपुट निकालने के लिए उपयोग किए गए। वॉशिंगटन में चीनी दूतावास ने दावों को निराधार और मानहानि कहा, IP संरक्षण के प्रति प्रतिबद्धता दोहराते हुए और चीनी कंपनियों के अनुचित दमन का विरोध करते हुए। समय मायने रखता है: यह मेमो 14 मई तक पुनर्निर्धारित ट्रम्प-शी शिखर सम्मेलन से तीन सप्ताह पहले आया है।
डिस्टिलेशन विदेशी नहीं है। आप एक बड़े शिक्षक मॉडल द्वारा उत्पन्न आउटपुट पर एक छोटे छात्र मॉडल को प्रशिक्षित करते हैं, logits या प्रतिक्रिया वितरण का मिलान करते हैं। अच्छी तरह से किया गया, छात्र शिक्षक की क्षमता का एक आश्चर्यजनक अंश पैरामीटर के एक अंश पर पकड़ता है। जो इसे विवादास्पद बनाता है वह API शर्तें हैं। OpenAI और Anthropic दोनों प्रतिस्पर्धी मॉडल प्रशिक्षित करने के लिए आउटपुट उपयोग पर रोक लगाते हैं, और जेलब्रेक प्रॉम्प्ट स्पष्ट रूप से प्रतिबंधित हैं। यहाँ दो आरोप उलझे हुए हैं। एक संविदात्मक है: DeepSeek, Moonshot AI, और MiniMax जैसी फर्मों ने कथित तौर पर स्क्रैप्ड आउटपुट पर प्रशिक्षण देकर ToS का उल्लंघन किया। दूसरा परिचालनात्मक है: हज़ारों प्रॉक्सी खाते और जेलब्रेक प्रॉम्प्ट रेट सीमा और सुरक्षा फ़िल्टर से बचने के लिए।
गुरुवार को जो बदला वह यह है कि एक ToS विवाद राष्ट्रीय सुरक्षा फ्रेमिंग बन गया। Kratsios का मेमो संविदात्मक प्रवर्तन को, जो सामान्यतः API प्रतिबंध, रेट सीमा और दीवानी मुकदमों के माध्यम से संभाला जाता है, संप्रभु IP प्रश्न में बदल देता है। यह निर्यात नियंत्रण, संस्था सूची में जोड़े जाने और चिप प्रतिबंधों द्वारा पहले से उत्पन्न द्विपक्षीय वृद्धि के प्रकार को आमंत्रित करता है। मेमो की अस्पष्टता इसकी विशेषता है: औद्योगिक-पैमाने कोई विशिष्ट डॉलर आंकड़ा या विशिष्ट घटना नाम नहीं देता, लेकिन कूटनीतिक मुद्रा स्थापित करता है। Anthropic और OpenAI महीनों से सार्वजनिक रूप से डिस्टिलेशन चिंताएं उठा रहे हैं; यह मेमो कार्यकारी स्तर पर उन चिंताओं की पुष्टि करता है।
यदि आप API-आधारित फ्रंटियर मॉडल से आउटपुट का उपयोग करके मॉडल प्रशिक्षित कर रहे हैं, तो आपका कानूनी जोखिम अभी-अभी कई गुना बढ़ गया। जो पहले ToS उल्लंघन था, बुरा लेकिन सीमित, अब राष्ट्रीय सुरक्षा-प्रासंगिक IP की चोरी के रूप में फ्रेम किया जा रहा है। यह चीन के बाहर के builders के लिए भी मायने रखता है। पहले अपने प्रशिक्षण पाइपलाइन में GPT या Claude से सिंथेटिक डेटा मिलाना संविदात्मक जोखिम रखता था; अब यह राजनीतिक जोखिम रखता है, विशेष रूप से यदि आप परिणामी मॉडल वितरित कर रहे हैं। ईमानदार रास्ता स्पष्ट है: यदि आप यह नहीं समझा सकते कि प्रत्येक प्रशिक्षण संकेत कहाँ से आया और किसके ToS उस पर लागू होते हैं, तो आपके पास एक आपूर्ति-श्रृंखला समस्या है जो चुप नहीं रहेगी।
