Zubnet AIसीखेंWiki › पाठ्यक्रम शिक्षण (Curriculum Learning)
प्रशिक्षण

पाठ्यक्रम शिक्षण (Curriculum Learning)

एक प्रशिक्षण रणनीति जो उदाहरणों को एक अर्थपूर्ण क्रम में प्रस्तुत करती है — आमतौर पर आसान से कठिन — बजाय यादृच्छिक रूप से। जैसे एक छात्र को कैलकुलस से पहले अंकगणित पढ़ाना, पाठ्यक्रम शिक्षण मॉडल को पहले बुनियादी पैटर्न देता है और धीरे-धीरे जटिलता बढ़ाता है। इससे तेज़ अभिसरण और कभी-कभी बेहतर अंतिम प्रदर्शन हो सकता है।

यह क्यों मायने रखता है

पाठ्यक्रम शिक्षण एक कम-सराहित तकनीक है जो मॉडल या डेटा बदले बिना प्रशिक्षण दक्षता में सुधार कर सकती है। LLM प्री-ट्रेनिंग तेज़ी से डेटा शेड्यूलिंग का उपयोग करती है — अंतिम प्रशिक्षण चरणों में स्वच्छ, उच्च-गुणवत्ता डेटा दिखाना — जो पाठ्यक्रम शिक्षण का एक रूप है। आप डेटा किस क्रम में प्रस्तुत करते हैं यह मायने रखता है, सिर्फ़ डेटा ही नहीं।

गहन अध्ययन

अंतर्ज्ञान: यादृच्छिक प्रशिक्षण क्रम का अर्थ है कि मॉडल कठिन उदाहरणों से पहले मिलता है इससे पहले कि उसके पास उनसे सीखने की नींव हो, जिससे ग्रेडिएंट अपडेट बर्बाद होते हैं। आसान, स्पष्ट उदाहरणों से शुरू करने से, मॉडल बुनियादी प्रतिनिधित्व बनाता है जो कठिन उदाहरणों को सीखने योग्य बनाते हैं। Bengio et al. (2009) ने इसे औपचारिक रूप दिया, दिखाया कि पाठ्यक्रम प्रशिक्षण तेज़ी से अभिसरित होता है और कभी-कभी यादृच्छिक क्रम की तुलना में बेहतर समाधान तक पहुँचता है।

LLM प्री-ट्रेनिंग में

आधुनिक LLM प्रशिक्षण डेटा मिक्सिंग शेड्यूल के माध्यम से पाठ्यक्रम शिक्षण का एक रूप उपयोग करता है। शुरुआती प्रशिक्षण वेब टेक्स्ट का व्यापक मिश्रण उपयोग कर सकता है। बाद के चरण उच्च-गुणवत्ता डेटा (क्यूरेटेड टेक्स्ट, कोड, गणित, तर्क) का अनुपात बढ़ाते हैं। कुछ प्रशिक्षण रेसिपी अंतिम चरण में प्रीमियम डेटा पर "anneal" करती हैं — मॉडल पहले व्यापक पैटर्न सीखता है, फिर सावधानी से चुने गए उदाहरणों पर परिष्कृत करता है। यह डेटा शेड्यूलिंग फ्रंटियर लैब्स के सबसे सख्ती से संरक्षित रहस्यों में से एक है।

स्व-गति शिक्षण

स्व-गति शिक्षण (Self-paced learning) एक संस्करण है जहाँ मॉडल स्वयं तय करता है कि क्या आसान है या कठिन, प्रत्येक उदाहरण पर अपने वर्तमान loss के आधार पर। कम loss वाले उदाहरण (पहले से सीखे गए) को कम प्राथमिकता दी जाती है, जबकि मध्यम loss वाले उदाहरण (चुनौतीपूर्ण लेकिन सीखने योग्य) को ज़ोर दिया जाता है। बहुत अधिक loss वाले उदाहरण (शोर, गलत लेबल डेटा) को भी संभावित outliers के रूप में कम प्राथमिकता दी जाती है। यह अनुकूली पाठ्यक्रम मॉडल के सुधरने के साथ स्वचालित रूप से समायोजित होता है।

संबंधित अवधारणाएँ

← सभी शब्द
← परत (Layer) पूर्वाग्रह →
ESC