स्लॉप: परिभाषा और अर्थ — AI विकी

कम गुणवत्ता के, सामान्य, अवांछित AI-जनित सामग्री जो इंटरनेट को भर देता है। 2024 में यह शब्द एक अपमानजनक शब्द के रूप में उत्पन्न हुआ, जो खराब AI टेक्स्ट, चित्रों और वीडियो की तरंग के लिए है, जो खोज परिणामों, सोशल मीडिया फीड और ऑनलाइन बाजारों को दूषित करता है। स्लॉप AI के स्पैम के समकक्ष है — तकनीकी रूप से 'सामग्री' होता है लेकिन कोई मूल्य नहीं जोड़ता, अक्सर अन्य स्लॉप से अंतर नहीं कर सकता, और जिस प्लेटफॉर्म को छूता है उसकी गुणवत्ता कम करता है। लिंक्डइन पोस्ट सोचें जो 'आजकल के तेजी से चल रहे दुनिया' से शुरू होते हैं, छह अंगूठे वाले हाथ वाली स्टॉक फोटो या 2,000 शब्दों में कुछ नहीं कहते वाले SEO लेख।

यह क्यों मायने रखता है

स्लॉप एक वातावरणीय लागत है जो सामग्री उत्पादन को मुफ्त बनाने के कारण होती है। जब कोई भी व्यक्ति कुछ मिनटों में १,००० ब्लॉग पोस्ट या १०,००० उत्पाद छवियों को उत्पन्न कर सकता है, तो सामग्री निर्माण की अर्थव्यवस्था टूट जाती है — और गुणवत्ता उसके साथ टूट जाती है। स्लॉप ही वजह है कि प्लेटफॉर्म एआई पहचान बनाने के लिए तेजी से प्रतिस्पर्धा कर रहे हैं, जबकि गूगल अपने खोज एल्गोरिदम को अपडेट करता रहता है, और 'मनुष्य द्वारा बनाया गया' क्यों बिक्री का बिंदु बन रहा है। यह अतिसरल 'AI will democratize creativity' नारा के खिलाफ सबसे मजबूत तर्क भी है।

गहन अध्ययन

"Slop" शब्द 2024 की शुरुआत में AI शब्दावली में प्रवेश किया, और यह चिपक गया क्योंकि यह सही था। Simon Willison, वह डेवलपर और blogger जिन्होंने इस शब्द को लोकप्रिय बनाने के लिए किसी से अधिक किया, ने email spam के साथ एक सीधी रेखा खींची: जैसे "spam" Monty Python के एक sketch से अवांछित ईमेल के लिए सार्वभौमिक शब्द बन गया, "slop" ने कुछ ऐसा नाम दिया जिसका अनुभव हर कोई पहले से कर रहा था लेकिन जिसके लिए शब्द नहीं था — internet पर हर platform को डुबाने वाली low-quality, AI-generated सामग्री की ज्वारीय लहर। उपमा naming से अधिक गहराई तक जाती है। Spam ने email को बर्बाद नहीं किया क्योंकि कोई एकल spam संदेश खतरनाक था। इसने email को बर्बाद किया क्योंकि भेजने की लागत शून्य पर गिर गई जबकि filtering की लागत उच्च बनी रही। Slop उसी तरह काम करता है। जब एक 2,000-शब्द लेख generate करने में एक प्रतिशत के एक अंश की लागत आती है और बारह सेकंड लगते हैं, तो content creation का अर्थशास्त्र मौलिक रूप से टूट जाता है। यह शब्द लोकप्रिय हुआ क्योंकि लोग पहले से ही गुस्से में थे — उन्हें बस एक ऐसे शब्द की ज़रूरत थी जो भावना से मेल खाने के लिए पर्याप्त तीखा हो।

Slop ecosystem

पैसे का अनुसरण करें और slop ecosystem खुद को नक़्शा करता है। SEO content farms सबसे शुरुआती और सबसे विपुल अपनाने वाले थे — outfits जो $15 प्रति लेख freelancers को भुगतान कर रहे थे, उन्हें एहसास हुआ कि वे लगभग कुछ भी नहीं के लिए प्रति दिन हज़ारों posts generate कर सकते हैं और keyword-stuffed पृष्ठों के साथ Google पर carpet-bomb कर सकते हैं। Amazon के Kindle Direct Publishing platform पर AI-generated किताबों की बाढ़ आ गई, उनमें से कुछ वास्तविक लेखकों को attribute की गईं जिनका उनसे कोई लेना-देना नहीं था, अन्य "ChatGPT द्वारा लिखित" के रूप में बेची गईं जैसे कि वह एक selling point हो। Etsy, जो कभी हस्तनिर्मित वस्तुओं का स्वर्ग था, अपने marketplace को AI-generated art prints और "digital downloads" से दबा हुआ देखा जो बस $2.99 में बेचे गए Midjourney outputs थे। LinkedIn engagement bait का बंजर भूमि बन गया — वे असहनीय posts जो "मैंने अभी अपने सबसे अच्छे कर्मचारी को निकाल दिया। यहाँ क्यों यह मेरा सबसे अच्छा निर्णय था।" से शुरू होते हैं, उन लोगों द्वारा लिखे गए जिन्होंने स्पष्ट रूप से कभी किसी को नहीं निकाला और शायद कर्मचारी ही नहीं हैं। और फिर fake news sites हैं: AI-generated लेखों, AI-generated bylines, और AI-generated लेखक तस्वीरों के साथ पूरे प्रकाशन, केवल विज्ञापन राजस्व के लिए optimized प्रशंसनीय-लगने वाली कहानियाँ निकाल रहे हैं। इनमें से कोई भी अभिनेता भ्रमित नहीं है कि वे क्या कर रहे हैं। वे जानते हैं कि यह slop है। उन्हें बस परवाह नहीं है, क्योंकि पैसा वास्तविक है भले ही सामग्री न हो।

Model collapse और ज़हरीला कुआँ

यहाँ slop सिर्फ़ एक झुँझलाहट नहीं, एक अस्तित्वगत समस्या बन जाता है। AI मॉडल internet डेटा पर प्रशिक्षित होते हैं। internet तेज़ी से AI-generated सामग्री से भरा होता जा रहा है। तो क्या होता है जब मॉडलों की अगली पीढ़ी पिछली पीढ़ी के आउटपुट पर प्रशिक्षित होती है? शोधकर्ता इसे model collapse कहते हैं — एक recursive क्षरण जहाँ AI-पर-प्रशिक्षित-AI की हर पीढ़ी निष्ठा, विविधता और सटीकता खो देती है, जैसे एक photocopy की photocopy हर बार धुंधली हो जाती है। Oxford विश्वविद्यालय से 2023 के एक paper ने इसे अनुभवजन्य रूप से प्रदर्शित किया: अपने आउटपुट पर प्रशिक्षित भाषा मॉडलों ने उत्तरोत्तर distribution की tails का प्रतिनिधित्व करने की क्षमता खो दी, एक तेज़ी से संकीर्ण और सामान्य शैली पर converge हुए। व्यावहारिक परिणाम यह है कि pre-2023 internet — जैसा वह generative AI द्वारा हर platform को बाढ़ में डालने से पहले मौजूद था — प्रशिक्षण डेटा के रूप में असाधारण रूप से मूल्यवान बन रहा है क्योंकि यह मनुष्यों द्वारा लिखा गया था। कंपनियाँ अब pre-AI datasets के लिए premium क़ीमत चुका रही हैं और "certified human" सामग्री के लिए प्रकाशकों के साथ deals कर रही हैं। विडंबना मोटी है: वे tools जो सामग्री को प्रचुर बनाने के लिए थे, authentic सामग्री को दुर्लभ बना रहे हैं।

Platforms वापस लड़ते हैं (एक तरह से)

Platform की प्रतिक्रिया वास्तविक प्रयास और प्रदर्शनकारी हाथ-मरोड़ने का मिश्रण रही है। Google का Helpful Content Update, 2023 और 2024 में रोल आउट हुआ, ने स्पष्ट रूप से उन AI-generated पृष्ठों को निशाना बनाया जो किसी की मदद करने के बजाय केवल search results में rank करने के लिए मौजूद हैं। इसने कुछ सबसे बुरी content farms पर traffic को धराशायी कर दिया, लेकिन हथियारों की दौड़ जारी है — slop generators algorithms के पकड़ने से तेज़ी से अनुकूलित होते हैं। Reddit ने सख़्त रुख़ अपनाया, कई प्रमुख subreddits ने AI-generated सामग्री पर पूरी तरह प्रतिबंध लगा दिया, और Google search results में site की बढ़ी हुई दृश्यता (दोनों कंपनियों के बीच एक deal के लिए धन्यवाद) "शायद मानव-लिखित" के लिए एक प्रॉक्सी signal बन गया। Stack Overflow ने दिसंबर 2022 में AI-generated उत्तरों पर प्रतिबंध लगा दिया जब moderators ने आत्मविश्वासी-लगने वाले लेकिन सूक्ष्म रूप से ग़लत उत्तरों की बाढ़ देखी — बिल्कुल वैसी ही प्रशंसनीय बकवास जिसे LLMs उत्पन्न करने में उत्कृष्ट हैं। नियामक पक्ष पर, EU AI Act और विभिन्न राष्ट्रीय पहलों ने AI-generated सामग्री watermarking और disclosure mandates के लिए धक्का दिया है, हालाँकि प्रवर्तन काफी हद तक सैद्धांतिक बना हुआ है। इस लड़ाई को जीतने वाले platforms वे हैं जो मशीनों का पता लगाने की कोशिश के बजाय मनुष्यों को verify करते हैं — क्योंकि हर महीने मानव लेखन की नक़ल करने में बेहतर होते मॉडलों के खिलाफ़ पता लगाना एक हारने वाला खेल है।

यह feature है, bug नहीं

आइए ईमानदार रहें कि slop वास्तव में क्या है: यह generative AI की विफलता नहीं है। यह generative AI जैसा कि डिज़ाइन किया गया है ठीक वैसे ही काम कर रहा है, उन लोगों के हाथों में जिनके incentives आपके साथ misaligned हैं। वही tool जो एक solo डेवलपर को अपने open-source प्रोजेक्ट के लिए दस्तावेज़ीकरण लिखने देता है, एक content mill को रात भर में दस हज़ार कचरा लेख generate करने देता है। वही image generator जो एक indie game designer को concept art prototype करने में मदद करता है, एक print-on-demand grifter को Amazon को AI-generated coloring books से बाढ़ में डालने देता है। आप एक ऐसी तकनीक नहीं बना सकते जो creation को effortless बनाती है और फिर आश्चर्यचकित होने का नाटक करते हैं जब effortless creation ज्यादातर कचरा है — यही effortless का अर्थ है। असली प्रश्न, जिसका अभी तक किसी के पास अच्छा उत्तर नहीं है, यह है कि क्या platforms generators के slop बनाने से तेज़ी से filters बना सकते हैं। अब तक, generators जीत रहे हैं। और वे जीतते रहेंगे जब तक विषमता बनी रहती है: generate करने में कुछ खर्च नहीं होता, filter करने में सब कुछ खर्च होता है। जब तक कोई उस आर्थिक समीकरण को हल नहीं करता, slop जाने वाला नहीं है। यह नया आधार है। फ़र्श बस गिर गया, और हम सब उसमें खड़े हैं।

स्लॉप