Cisco का Model Provenance Kit: AI मॉडल वज़न पर फ़िंगरप्रिंट, 150 मॉडल का डेटाबेस

अगर आपने कभी एक फ़ाइन-ट्यून्ड चेकपॉइंट विरासत में लिया है और साफ़ तरीक़े से पुष्टि नहीं कर पाए कि वह किस से ट्यून हुआ था, तो Cisco का नया Model Provenance Kit ठीक उसी अंतर को निशाना बनाता है। ओपन-सोर्स Python टूलकिट और CLI के रूप में जारी, MPK मॉडल को वज़न स्तर पर फ़िंगरप्रिंट करता है — आर्किटेक्चर मेटाडेटा, टोकनाइज़र संरचना, और सीखे हुए वज़न को जाँच कर यह तय करता है कि दो ट्रांसफ़ॉर्मर एक ही उत्पत्ति साझा करते हैं या नहीं।

टूल दो मोड के साथ आता है। Compare किन्हीं दो मॉडलों के बीच विस्तृत समानता विश्लेषण देता है। Scan एकल मॉडल को एक प्रारंभिक फ़िंगरप्रिंट डेटाबेस से मिलाता है जिसमें लगभग 150 बेस मॉडल हैं, जो 45 परिवारों और 20 प्रकाशकों में फैले हैं, और जिनके पैरामीटर 135M से 70B से अधिक तक हैं। यह sigstore/model-transparency जैसे sigstore-शैली के अटेस्टेशन प्रोजेक्ट से अलग रुख है — वे प्रकाशन समय पर आर्टिफ़ैक्ट पर हस्ताक्षर करते हैं। Cisco का दृष्टिकोण मानता है कि आर्टिफ़ैक्ट पहले से आपके हाथ में है और आपको वज़न से ही वंशावली निकालनी है — तब उपयोगी जब अपस्ट्रीम साइनिंग कभी नहीं हुई या जब मॉडल बिना दस्तावेज़ के आता है।

वज़न-स्तरीय फ़िंगरप्रिंटिंग उस अंतर को भरती है जो अकेले हस्ताक्षर नहीं भरते। हर फ़ाइन-ट्यून, हर LoRA मर्ज, HuggingFace पुल में हर बिना श्रेय वाला फ़ॉर्क — हर जगह वंशावली खो जाती है। यूरोपीय AI Act की उत्पत्ति आवश्यकताओं पर निर्भर नियामक, ज़हरीले बेस मॉडलों के लिए स्कैन करती सुरक्षा टीमें, अपस्ट्रीम CVE के बाद घटना प्रतिक्रिया — सभी को बिना मैनिफ़ेस्ट पर भरोसा किए "यह मॉडल असल में क्या है?" पूछने का एक तरीक़ा चाहिए। यह वह बुनियादी ढाँचा है जिसे रैपर इकोनॉमी चुपचाप छोड़ रही थी: नया मॉडल नहीं, बल्कि यह जानने का तरीक़ा कि आप किस पर खड़े हैं।

अगर आप कुछ भी ऐसा डिलीवर करते हैं जो तीसरे पक्ष के मॉडल लेता है — आंतरिक AI प्लेटफ़ॉर्म, मॉडल मार्केटप्लेस, फ़ाइन-ट्यून सेवाएँ — रेपो क्लोन करें, अपनी इन्वेंटरी पर Scan चलाएँ, देखें क्या निकलता है। फ़िंगरप्रिंट डेटाबेस अभी पहले 150 का है; योगदानकर्ता जितना जोड़ें, मूल्य उतना बढ़ता है। अगर आप बेस मॉडल प्रकाशित करते हैं, फ़िंगरप्रिंट योगदान देना ही वह तरीक़ा है जिससे इकोसिस्टम वंशावली पर ईमानदार होता है।

Cisco का Model Provenance Kit: AI मॉडल वज़न पर फ़िंगरप्रिंट, 150 मॉडल का डेटाबेस

और समाचार