जनरेटिव AI: परिभाषा और अर्थ — AI विकी

AI प्रणालियाँ जो नए सामग्री — पाठ, चित्र, ऑडियो, वीडियो, कोड, 3D मॉडल — बनाती हैं, बजाय मौजूदा डेटा के विश्लेषण या वर्गीकरण करने के। जननात्मक AI सभी चीजों के लिए एक छाता शब्द है, चाहे वह ChatGPT द्वारा निबंध लिखना हो, Stable Diffusion द्वारा चित्र बनाना हो या Suno द्वारा संगीत लिखना हो। "जननात्मक" भाग इन मॉडलों को पहले के AI से अलग करता है, जो केवल वर्गीकृत कर सकता था, भविष्यवाणी कर सकता था या सिफारिश कर सकता था।

यह क्यों मायने रखता है

जेनेरेटिव AI वह शब्द है जिसने AI को मुख्यधारा संस्कृति में लाया। यही वह चीज है जिसका लोग 2024-2026 में "AI" कहते समय अभिप्रेत होते हैं — सृजन करने की क्षमता, केवल गणना करने के बजाय। इसे एक श्रेणी के रूप में समझना आपको इस क्षेत्र के संदर्भ में नेविगेट करने में मदद करता है: बड़े भाषा मॉडल (LLMs) टेक्स्ट उत्पन्न करते हैं, विसरण मॉडल छवियाँ उत्पन्न करते हैं, और मोडलिटीज के बीच सीमाएं तेजी से गायब हो रही हैं।

गहन अध्ययन

हर generative AI सिस्टम, modality की परवाह किए बिना, एक conceptual स्तर पर लगभग वही चीज़ करता है: यह अपने प्रशिक्षण डेटा का सांख्यिकीय distribution सीखता है, फिर नए आउटपुट उत्पन्न करने के लिए उस distribution से sample करता है। एक भाषा मॉडल शब्दों के अनुक्रमों पर probability distribution सीखता है — internet पर लिखी गई हर चीज़ को देखते हुए, कौन सा token अगला आने की सबसे संभावना है? एक image मॉडल pixel arrangements के distribution को सीखता है जो "एक बिल्ली की तस्वीर" बनाम "सूर्यास्त की एक तेल चित्र" का गठन करते हैं। आउटपुट डेटाबेस से retrieved नहीं होता है। यह सीखे गए patterns द्वारा निर्देशित, token by token या pixel by pixel, निर्मित होता है। यही है जो generative AI को search engines या recommendation systems से वास्तव में अलग बनाता है: यह ऐसी चीज़ें उत्पन्न करता है जो पहले मौजूद नहीं थीं, उन patterns से इकट्ठा की गईं जिन्हें इसने प्रशिक्षण के दौरान अवशोषित किया।

Modalities और इनके owners

Text generation पर बड़े भाषा मॉडल हावी हैं। OpenAI की GPT श्रृंखला, Anthropic का Claude, Google का Gemini, और Meta का ओपन-वेट Llama परिवार प्रमुख खिलाड़ी हैं, दर्जनों छोटी labs और open-source projects niches भर रहे हैं। Image generation दो शिविरों में विभाजित हुआ: diffusion मॉडल (Stability AI का Stable Diffusion, Midjourney, DALL-E 3) और नए flow-matching दृष्टिकोण। वीडियो generation बाद में आया और कठिन बना हुआ है — Runway, Pika, Google का Veo, और OpenAI का Sora वर्तमान सीमा का प्रतिनिधित्व करते हैं, लेकिन वीडियो उत्पन्न करना महंगा है और अभी भी temporal एकरूपता के साथ संघर्ष करता है। Audio generation speech synthesis (ElevenLabs, OpenAI के voice मॉडल), संगीत composition (Suno, Udio), और sound effects को फैलाता है। Code generation अपनी श्रेणी बन गया है, GitHub Copilot, Cursor, और विभिन्न Claude- और GPT-संचालित coding सहायकों के साथ कि कैसे software लिखा जाता है को बदलना। 3D मॉडल generation सबसे युवा modality है, Meshy, Tripo जैसे tools, और NVIDIA से शोध text या image prompts से उपयोग योग्य meshes और textures उत्पन्न करना शुरू कर रहे हैं। सभी modalities में रुझान वही है: गुणवत्ता हर छह महीने में नाटकीय रूप से बेहतर होती है, लागत गिरती है, और "AI-generated" तथा "human-created" के बीच का अंतर संकीर्ण होता है।

2022 inflection बिंदु

Generative AI mainstream जाने से पहले वर्षों तक मौजूद था। GPT-2 2019 में पारित होने योग्य paragraphs लिख सकता था। DALL-E ने 2021 की शुरुआत में कच्ची छवियाँ उत्पन्न कीं। लेकिन 2022 में दो रिलीज़ ने सब कुछ बदल दिया। Stable Diffusion, अगस्त 2022 में open-source जारी किया गया, ने image generation को किसी के भी laptop पर मुफ़्त में रखा — रात भर में, लाखों लोग ऐसी छवियाँ बना रहे थे जिनके लिए एक professional artist या stock photo subscription की आवश्यकता होती। फिर ChatGPT नवंबर 2022 में launch हुआ, दो महीनों में 100 मिलियन उपयोगकर्ताओं तक पहुँचा। पहले-और-बाद का अंतर तीव्र है। 2022 से पहले, generative AI एक शोध जिज्ञासा थी जिस पर NeurIPS में चर्चा होती थी। 2022 के बाद, यह boardroom meetings, स्कूल नीति बहसों, और रात के खाने की मेज़ पर एक विषय था। तकनीक स्वयं धीरे-धीरे सुधर रही थी, लेकिन interface सफलता — इसे conversational, सुलभ, मुफ़्त बनाना — वही है जिसने सांस्कृतिक shift को trigger किया।

व्यवहार में इसने क्या बदला

व्यापार प्रभाव असमान रहा है लेकिन वास्तविक है। सामग्री निर्माण इसे महसूस करने वाला पहला उद्योग था: marketing copy, social media posts, blog लेख, उत्पाद विवरण — ऐसे कार्य जो एक लेखक को घंटे लेते थे अब सेकंडों में draft किए जा सकते हैं। ग्राहक सेवा ने chatbots और AI सहायकों को अपनाया जो routine queries संभालते हैं, मानव agents केवल कठिन मामलों को escalate करते हैं। Software विकास ने सबसे मापने योग्य उत्पादकता लाभ देखे, अध्ययन दिखाते हैं कि developers AI सहायकों का उपयोग करते समय 30–55% तेज़ कोड completion। Creative tools ने generative AI को board भर में एकीकृत किया: Adobe ने Photoshop में generative fill जोड़ा, Canva ने text-to-image embed किया, और वीडियो editing tools ने AI-संचालित scene generation और editing प्रदान करना शुरू किया। पैटर्न लगातार है — generative AI कुशल लोगों के लिए एक त्वरक के रूप में सबसे अच्छा काम करता है, उनके प्रतिस्थापन के रूप में नहीं। AI tools वाला एक अच्छा लेखक अधिक और तेज़ी से उत्पादन करता है। AI tools वाला एक बुरा लेखक अधिक बुरा लेखन तेज़ी से उत्पन्न करता है।

असुविधाजनक प्रश्न

Generative AI ने internet की सामग्री और internet की समस्याएँ विरासत में ली हैं। Copyright सबसे क़ानूनी रूप से सक्रिय चिंता है: copyrighted text, छवियों, और संगीत पर प्रशिक्षित मॉडलों को New York Times, Getty Images, और हज़ारों व्यक्तिगत creators से मुक़दमों का सामना करना पड़ता है जिन्होंने कभी सहमति नहीं दी कि उनके काम को प्रशिक्षण डेटा के रूप में उपयोग किया जाए। क़ानूनी परिणाम पूरे क्षेत्र की अर्थव्यवस्था को आकार देंगे। Job displacement वास्तविक है लेकिन सुर्खियाँ सुझाव देने से धीमी है — translation, copywriting, illustration, और बुनियादी coding सभी entry-level मानव कार्य के लिए घटी हुई माँग देख रहे हैं, लेकिन "AI सबको बदल देता है" narrative प्रकट नहीं हुआ है। Misinformation एक संरचनात्मक समस्या है: यदि convincing text और छवियाँ उत्पन्न करना लगभग कुछ नहीं खर्च करता है, तो प्रशंसनीय-दिखने वाली false सामग्री की मात्रा बिना सीमा के scale होती है। और गुणवत्ता flooding — internet को भर रही AI-generated सामग्री की विशाल मात्रा — पहले से ही search results, social media feeds, और app stores को degrade कर रही है। ये काल्पनिक जोखिम नहीं हैं। वे अभी हो रहे हैं, और उन्हें detect और manage करने के लिए tools लगातार सामग्री उत्पन्न करने के tools के पीछे हैं।

जनरेटिव AI