Zubnet AIसीखेंWiki › Beam Search
मूल तत्व

Beam Search

एक डीकोडिंग रणनीति जो एक साथ कई उम्मीदवार अनुक्रमों ("beam") को बनाए रखती है, प्रत्येक चरण में प्रत्येक को एक टोकन से विस्तारित करती है और केवल शीर्ष-स्कोरिंग उम्मीदवारों को रखती है। Greedy decoding (हमेशा सबसे अच्छा अगला टोकन चुनें) या sampling (यादृच्छिक रूप से चुनें) के विपरीत, beam search कई रास्तों का पता लगाता है और समग्र उच्चतम-संभाव्यता अनुक्रम पाता है। आमतौर पर अनुवाद और सारांशीकरण के लिए उपयोग किया जाता है।

यह क्यों मायने रखता है

Beam search दिखाता है कि स्थानीय रूप से सबसे अच्छा विकल्प हमेशा वैश्विक रूप से सबसे अच्छा नहीं होता। Greedy decoding पहले शब्द के रूप में "The" चुन सकता है जबकि "In" बहुत बेहतर समग्र वाक्य की ओर ले जाता। कई उम्मीदवारों को रखकर, beam search बहुत जल्दी प्रतिबद्ध होने से बचता है। हालांकि, ओपन-एंडेड जनरेशन (चैट, रचनात्मक लेखन) के लिए, sampling beam search की तुलना में अधिक विविध और स्वाभाविक टेक्स्ट उत्पन्न करता है।

गहन अध्ययन

एल्गोरिदम: चौड़ाई k (जैसे, k=5) का एक beam बनाए रखें। प्रत्येक चरण में, प्रत्येक उम्मीदवार को सभी संभव अगले टोकन से विस्तारित करें, परिणामी अनुक्रमों को स्कोर करें, और शीर्ष k को रखें। तब तक जारी रखें जब तक सभी उम्मीदवारों ने एक अंत टोकन उत्पन्न नहीं कर दिया या लंबाई सीमा तक नहीं पहुंच गए। उच्चतम-स्कोरिंग पूर्ण अनुक्रम लौटाएं। Beam चौड़ाई k गुणवत्ता बनाम compute का ट्रेड-ऑफ़ है: k=1 greedy decoding है, बड़ा k अधिक रास्तों का पता लगाता है लेकिन k गुना अधिक compute खर्च करता है।

लंबाई दंड समस्या

कच्चा beam search छोटे अनुक्रमों का पक्ष लेता है (कम टोकन = कम संभाव्यता गुणन = उच्च कुल संभाव्यता)। एक लंबाई दंड (स्कोर को length^α से विभाजित करना) इस पूर्वाग्रह को प्रतिसंतुलित करता है, मॉडल को जल्दी काटने के बजाय पूर्ण, सुव्यवस्थित आउटपुट उत्पन्न करने के लिए प्रोत्साहित करता है। दंड कारक α एक हाइपरपैरामीटर है: α=0 कोई दंड नहीं है, α=1 लंबाई से पूरी तरह सामान्यीकृत करता है। विशिष्ट मान 0.6–1.0 हैं।

Beam Search का उपयोग कब करें

Beam search उन कार्यों के लिए सबसे अच्छा काम करता है जिनका एक "सही" उत्तर होता है (अनुवाद, सारांशीकरण, संरचित जनरेशन) जहां आप single सबसे संभावित आउटपुट चाहते हैं। यह रचनात्मक या संवादात्मक कार्यों के लिए खराब काम करता है जहां विविधता मायने रखती है — beam search सामान्य, दोहराव वाला टेक्स्ट उत्पन्न करता है क्योंकि उच्च-संभाव्यता अनुक्रम अक्सर उबाऊ होते हैं। आधुनिक LLM इंटरफ़ेस चैट के लिए sampling (temperature और top-p के साथ) का उपयोग करते हैं, और beam search मुख्य रूप से आंतरिक रूप से विशिष्ट कार्यों जैसे tool-call जनरेशन के लिए उपयोग किया जाता है।

संबंधित अवधारणाएँ

← सभी शब्द
← Batch Size & Epoch BERT →