Zubnet AIसीखेंWiki › Zero-shot / Few-shot
AI उपयोग

Zero-shot / Few-shot

इसे भी कहा जाता है: इन-कॉन्टेक्स्ट लर्निंग
जीरो-शॉट मतलब है कि आप मॉडल को किसी उदाहरण के बिना कार्य करने के लिए पूछते हैं — केवल निर्देश। फीव-शॉट मतलब है कि वास्तविक अनुरोध से पहले प्रॉम्प्ट में कुछ इनपुट-आउटपुट उदाहरण प्रदान करना। "यहां 3 उदाहरण हैं कि इस डेटा को कैसे फॉर्मेट करें... अब इसे करें।" मॉडल प्रसंग के आधार पर ही पैटर्न सीखता है, ट्रेनिंग की आवश्यकता नहीं होती है।

यह क्यों मायने रखता है

कम-सैंपल प्रॉम्प्टिंग एक मॉडल को एक नए फॉर्मेट या व्यवहार को सिखाने के लिए सबसे तेज़ तरीका है। क्या आपको संगत JSON आउटपुट की आवश्यकता है? तीन उदाहरण दें। क्या आपको एक विशिष्ट लेखन शैली की आवश्यकता है? उदाहरण दें। यह नि: शुल्क, तुरंत और अचंबित रूप से शक्तिशाली है।

गहन अध्ययन

"ज़ेरो-शॉट" और "फ़ेव-शॉट" शब्द मशीन लर्निंग अनुसंधान परंपरा से आते हैं, जहां "शॉट" एक प्रशिक्षण उदाहरण के लिए होता है। क्लासिक ML में, आपको एक नए कार्य को सिखाने के लिए हजारों या मिलियन लेबल किए गए उदाहरणों की आवश्यकता होती है। बड़े भाषा मॉडलों के साथ खुलासा हुआ कि वे शून्य प्रशिक्षण उदाहरणों (ज़ेरो-शॉट) के साथ या अपने प्रॉम्प्ट में केवल कुछ उदाहरणों (फ़ेव-शॉट) के साथ कार्य कर सकते हैं। इसे "संदर्भ में सीखना" कहा जाता है, और यह आधुनिक LLM की सबसे अद्भुत क्षमताओं में से एक बना रहता है — जब आप प्रॉम्प्ट में उदाहरण देते हैं, तो मॉडल को पुनः प्रशिक्षित या फाइन-ट्यून नहीं किया जाता है। यह अपने संदर्भ में पैटर्न को पहचानता है और उन्हें तत्काल लागू करता है।

जब ज़ेरो-शॉट काम करता है

ज़ेरो-शॉट तब सबसे अच्छा काम करता है जब कार्य मॉडल द्वारा प्रशिक्षण में व्यापक रूप से देखे गए कुछ चीजों के साथ स्पष्ट रूप से मेल खाता है। भाव संवेदन, अनुवाद, सारांश, सरल वर्गीकरण — ये कार्य मॉडल के प्री-ट्रेनिंग के दौरान मिलियनों वेरिएशन में देखे गए हैं, इसलिए एक स्पष्ट निर्देश अक्सर पर्याप्त होता है। "इस ग्राहक समीक्षा को सकारात्मक, नकारात्मक या तटस्थ वर्गीकृत करें" कोई भी आधुनिक फ्रंटियर मॉडल पर ज़ेरो-शॉट में काम करेगा क्योंकि मॉडल वर्गीकरण, भाव और उन लेबल के अर्थ को गहराई से समझता है। ज़ेरो-शॉट असफल हो जाता है असामान्य फॉर्मेट, डोमेन विशिष्ट प्रथाओं या अमूल्य आवश्यकताओं वाले कार्यों पर। यदि आपको मॉडल के द्वारा अपनी कंपनी के निजी XML स्कीमा में डेटा निकालने की आवश्यकता है, तो एक खाली निर्देश इसे नहीं काटेगा।

फ़ेव-शॉट प्रॉम्प्टिंग उस खामी को भरता है। वास्तविक अनुरोध से पहले 2–5 इनपुट-आउटपुट उदाहरण प्रदान करके, आप मॉडल को अपेक्षा करते हुए बताते हैं। मॉडल फॉर्मेट, विवरण के स्तर, स्टाइल, किनारे के मामलों के पैटर्न को ग्रहण करता है और नए इनपुट पर लागू करता है। संरचित कार्यों के लिए यह अत्यंत शक्तिशाली है। गंदे पाठ से एंटिटी निकालने की आवश्यकता है एक विशिष्ट JSON फॉर्मेट में? तीन उदाहरण दें जहां गंदा पाठ साफ JSON में मैप किया गया है, फिर नए पाठ को दें। प्राकृतिक भाषा तारीखों ("अगले मंगलवार", "मार्च के दूसरे सप्ताह") को ISO 8601 में परिवर्तित करने की आवश्यकता है? तीन उदाहरण आपको उस बिंदु तक पहुंचाएंगे। मॉडल आपके उदाहरणों से एक फ़ंक्शन सीख रहा है और यह अपने अंतर्ज्ञान के समय बिना ग्रेडिएंट अपडेट के इसे कर रहा है।

गुणवत्ता बनाम मात्रा

आपके फ़ेव-शॉट उदाहरणों की गुणवत्ता मात्रा से अधिक महत्वपूर्ण है। तीन ध्यान से चुने गए उदाहरण जो विभिन्न किनारे के मामलों को कवर करते हैं, दस बार दोहराए गए उदाहरणों के बेहतर होंगे। यदि आपका कार्य श्रेणियों को शामिल करता है, तो प्रत्येक श्रेणी के लिए कम से कम एक उदाहरण शामिल करें। यदि कठिन सीमा के मामले हैं, तो एक शामिल करें। और उदाहरणों के क्रम महत्वपूर्ण हो सकता है — शोध दिखाता है कि मॉडल अंतिम उदाहरण के लेबल के प्रति झुकाव रख सकते हैं, इसलिए अपने उदाहरणों को बरक

संबंधित अवधारणाएँ

← सभी शब्द
← YAML Zhipu AI →
ESC