मार्च 2026 का एक शांत FTC समझौता इस हफ्ते एक जोरदार परिणाम पैदा कर रहा है: Clarifai ने 2014 में OkCupid से प्राप्त तीस लाख तस्वीरें मिटा दीं, साथ ही उन पर प्रशिक्षित हर model। Reuters ने कहानी तोड़ी, TechCrunch ने उठाया। Data साझा करने की व्यवस्था तब शुरू हुई जब Clarifai के founder और CEO Matthew Zeiler ने एक colleague को email भेजा: "हम अभी data collect कर रहे हैं और अभी realize किया कि OKCupid के पास निश्चित रूप से एक विशाल मात्रा में शानदार data है।" OkCupid के executives उस समय Clarifai में equity रखते थे, जो 2014 की तुलना में 2026 में बदतर दिखने वाला hit of interest का प्रकार है।
AI side पर परिणाम photo deletion स्वयं से अधिक दिलचस्प हैं। तीस लाख चेहरे की तस्वीरें एक उपयोगी लेकिन अभूतपूर्व नहीं training set है; Clarifai के पास बहुत data है। FTC agreement ने OkCupid data पर प्रशिक्षित हर model को भी मिटा दिया, जो एक अलग और बहुत कठिन category है। 2026 में model deletion का मतलब है: weights चले गए, embeddings चले गए, उन models से derive किए गए fine-tunes चले गए, plus जो भी derivative classifiers या customer deployments उन पर निर्भर थे। 2019 के New York Times के एक लेख ने मूल रूप से उजागर किया था कि Clarifai ने इस dataset का उपयोग करके चेहरों से उम्र, लिंग और जाति का अनुमान लगाने के tools बनाए थे — ये बिल्कुल वही प्रकार के models हैं जो downstream deployments उत्पन्न करते हैं, और वहीं पर practice में सफाई महंगी और अधूरी हो जाती है।
दो legal points नाम लेने लायक हैं। एक, FTC वित्तीय penalty नहीं लगा सका। यह उनके governing statute के तहत "इस प्रकार का पहला अपराध" है, और वे केवल compliance और prohibitions की मांग कर सकते हैं। OkCupid और Match Group को स्थायी रूप से data कैसे एकत्र किया जाता है और साझा किया जाता है, यह misrepresent करने या दूसरों को ऐसा करने में सहायता करने से प्रतिबंधित किया गया है। उन्होंने आरोपों को admit नहीं किया। दो, 2014 के data grab और 2026 के परिणाम के बीच बारह साल का अंतर एक अनुस्मारक है कि training-data देयता long timescales पर चलती है। 2019 NYT story ने FTC investigation को trigger किया; मार्च 2026 settlement ने इस महीने वास्तविक deletion produce किया। अगर आप आज user data पर train करते हैं, घड़ी अभी शुरू होती है, और half-life आपके ship किए अधिकांश models से लंबी है।
Builders के लिए दो बातें register करने के लिए। एक, "models को delete करो, केवल photos को नहीं" परिणाम उभरता regulatory template है। यही है कि GDPR-style right-to-erasure वास्तव में कैसा दिखता है जब ML systems पर लागू किया जाए। आपकी data lineage documentation (कौन सा model किस dataset पर trained था, कौन सा deployment किस model का उपयोग करता है) अब एक कानूनी artifact है, governance courtesy नहीं; अगर आप उस lineage को regulator के timeline पर produce नहीं कर सकते, आप defensively अपेक्षा से अधिक models delete करना समाप्त कर देंगे। दो, data-generating companies और AI-training companies के बीच executive cross-holdings अब एक ठोस liability class हैं। Zeiler का email इसलिए damning नहीं था कि यह crude था। यह इसलिए damning था कि OkCupid executives के पास Clarifai में equity थी, जिससे data-sharing self-dealing जैसा दिखा बजाय एक legitimate integration के। "हम पर भरोसा करो, हमारी privacy policy है" मुद्रा कानूनी रूप से टिक नहीं रही जब investments और emails एक अलग कहानी बताते हैं।
