Beam Search: परिभाषा और अर्थ — AI विकी

एक डीकोडिंग रणनीति जो एक साथ कई उम्मीदवार अनुक्रमों ("beam") को बनाए रखती है, प्रत्येक चरण में प्रत्येक को एक टोकन से विस्तारित करती है और केवल शीर्ष-स्कोरिंग उम्मीदवारों को रखती है। Greedy decoding (हमेशा सबसे अच्छा अगला टोकन चुनें) या sampling (यादृच्छिक रूप से चुनें) के विपरीत, beam search कई रास्तों का पता लगाता है और समग्र उच्चतम-संभाव्यता अनुक्रम पाता है। आमतौर पर अनुवाद और सारांशीकरण के लिए उपयोग किया जाता है।

यह क्यों मायने रखता है

Beam search दिखाता है कि स्थानीय रूप से सबसे अच्छा विकल्प हमेशा वैश्विक रूप से सबसे अच्छा नहीं होता। Greedy decoding पहले शब्द के रूप में "The" चुन सकता है जबकि "In" बहुत बेहतर समग्र वाक्य की ओर ले जाता। कई उम्मीदवारों को रखकर, beam search बहुत जल्दी प्रतिबद्ध होने से बचता है। हालांकि, ओपन-एंडेड जनरेशन (चैट, रचनात्मक लेखन) के लिए, sampling beam search की तुलना में अधिक विविध और स्वाभाविक टेक्स्ट उत्पन्न करता है।

गहन अध्ययन

एल्गोरिदम: चौड़ाई k (जैसे, k=5) का एक beam बनाए रखें। प्रत्येक चरण में, प्रत्येक उम्मीदवार को सभी संभव अगले टोकन से विस्तारित करें, परिणामी अनुक्रमों को स्कोर करें, और शीर्ष k को रखें। तब तक जारी रखें जब तक सभी उम्मीदवारों ने एक अंत टोकन उत्पन्न नहीं कर दिया या लंबाई सीमा तक नहीं पहुंच गए। उच्चतम-स्कोरिंग पूर्ण अनुक्रम लौटाएं। Beam चौड़ाई k गुणवत्ता बनाम compute का ट्रेड-ऑफ़ है: k=1 greedy decoding है, बड़ा k अधिक रास्तों का पता लगाता है लेकिन k गुना अधिक compute खर्च करता है।

लंबाई दंड समस्या

कच्चा beam search छोटे अनुक्रमों का पक्ष लेता है (कम टोकन = कम संभाव्यता गुणन = उच्च कुल संभाव्यता)। एक लंबाई दंड (स्कोर को length^α से विभाजित करना) इस पूर्वाग्रह को प्रतिसंतुलित करता है, मॉडल को जल्दी काटने के बजाय पूर्ण, सुव्यवस्थित आउटपुट उत्पन्न करने के लिए प्रोत्साहित करता है। दंड कारक α एक हाइपरपैरामीटर है: α=0 कोई दंड नहीं है, α=1 लंबाई से पूरी तरह सामान्यीकृत करता है। विशिष्ट मान 0.6–1.0 हैं।

Beam Search का उपयोग कब करें

Beam search उन कार्यों के लिए सबसे अच्छा काम करता है जिनका एक "सही" उत्तर होता है (अनुवाद, सारांशीकरण, संरचित जनरेशन) जहां आप single सबसे संभावित आउटपुट चाहते हैं। यह रचनात्मक या संवादात्मक कार्यों के लिए खराब काम करता है जहां विविधता मायने रखती है — beam search सामान्य, दोहराव वाला टेक्स्ट उत्पन्न करता है क्योंकि उच्च-संभाव्यता अनुक्रम अक्सर उबाऊ होते हैं। आधुनिक LLM इंटरफ़ेस चैट के लिए sampling (temperature और top-p के साथ) का उपयोग करते हैं, और beam search मुख्य रूप से आंतरिक रूप से विशिष्ट कार्यों जैसे tool-call जनरेशन के लिए उपयोग किया जाता है।

Beam Search

यह क्यों मायने रखता है

गहन अध्ययन

लंबाई दंड समस्या

Beam Search का उपयोग कब करें

संबंधित अवधारणाएँ