"ज़ेरो-शॉट" और "फ़ेव-शॉट" शब्द मशीन लर्निंग अनुसंधान परंपरा से आते हैं, जहां "शॉट" एक प्रशिक्षण उदाहरण के लिए होता है। क्लासिक ML में, आपको एक नए कार्य को सिखाने के लिए हजारों या मिलियन लेबल किए गए उदाहरणों की आवश्यकता होती है। बड़े भाषा मॉडलों के साथ खुलासा हुआ कि वे शून्य प्रशिक्षण उदाहरणों (ज़ेरो-शॉट) के साथ या अपने प्रॉम्प्ट में केवल कुछ उदाहरणों (फ़ेव-शॉट) के साथ कार्य कर सकते हैं। इसे "संदर्भ में सीखना" कहा जाता है, और यह आधुनिक LLM की सबसे अद्भुत क्षमताओं में से एक बना रहता है — जब आप प्रॉम्प्ट में उदाहरण देते हैं, तो मॉडल को पुनः प्रशिक्षित या फाइन-ट्यून नहीं किया जाता है। यह अपने संदर्भ में पैटर्न को पहचानता है और उन्हें तत्काल लागू करता है।
ज़ेरो-शॉट तब सबसे अच्छा काम करता है जब कार्य मॉडल द्वारा प्रशिक्षण में व्यापक रूप से देखे गए कुछ चीजों के साथ स्पष्ट रूप से मेल खाता है। भाव संवेदन, अनुवाद, सारांश, सरल वर्गीकरण — ये कार्य मॉडल के प्री-ट्रेनिंग के दौरान मिलियनों वेरिएशन में देखे गए हैं, इसलिए एक स्पष्ट निर्देश अक्सर पर्याप्त होता है। "इस ग्राहक समीक्षा को सकारात्मक, नकारात्मक या तटस्थ वर्गीकृत करें" कोई भी आधुनिक फ्रंटियर मॉडल पर ज़ेरो-शॉट में काम करेगा क्योंकि मॉडल वर्गीकरण, भाव और उन लेबल के अर्थ को गहराई से समझता है। ज़ेरो-शॉट असफल हो जाता है असामान्य फॉर्मेट, डोमेन विशिष्ट प्रथाओं या अमूल्य आवश्यकताओं वाले कार्यों पर। यदि आपको मॉडल के द्वारा अपनी कंपनी के निजी XML स्कीमा में डेटा निकालने की आवश्यकता है, तो एक खाली निर्देश इसे नहीं काटेगा।
फ़ेव-शॉट प्रॉम्प्टिंग उस खामी को भरता है। वास्तविक अनुरोध से पहले 2–5 इनपुट-आउटपुट उदाहरण प्रदान करके, आप मॉडल को अपेक्षा करते हुए बताते हैं। मॉडल फॉर्मेट, विवरण के स्तर, स्टाइल, किनारे के मामलों के पैटर्न को ग्रहण करता है और नए इनपुट पर लागू करता है। संरचित कार्यों के लिए यह अत्यंत शक्तिशाली है। गंदे पाठ से एंटिटी निकालने की आवश्यकता है एक विशिष्ट JSON फॉर्मेट में? तीन उदाहरण दें जहां गंदा पाठ साफ JSON में मैप किया गया है, फिर नए पाठ को दें। प्राकृतिक भाषा तारीखों ("अगले मंगलवार", "मार्च के दूसरे सप्ताह") को ISO 8601 में परिवर्तित करने की आवश्यकता है? तीन उदाहरण आपको उस बिंदु तक पहुंचाएंगे। मॉडल आपके उदाहरणों से एक फ़ंक्शन सीख रहा है और यह अपने अंतर्ज्ञान के समय बिना ग्रेडिएंट अपडेट के इसे कर रहा है।
आपके फ़ेव-शॉट उदाहरणों की गुणवत्ता मात्रा से अधिक महत्वपूर्ण है। तीन ध्यान से चुने गए उदाहरण जो विभिन्न किनारे के मामलों को कवर करते हैं, दस बार दोहराए गए उदाहरणों के बेहतर होंगे। यदि आपका कार्य श्रेणियों को शामिल करता है, तो प्रत्येक श्रेणी के लिए कम से कम एक उदाहरण शामिल करें। यदि कठिन सीमा के मामले हैं, तो एक शामिल करें। और उदाहरणों के क्रम महत्वपूर्ण हो सकता है — शोध दिखाता है कि मॉडल अंतिम उदाहरण के लेबल के प्रति झुकाव रख सकते हैं, इसलिए अपने उदाहरणों को बरक