Classification: परिभाषा और अर्थ — AI विकी

एक इनपुट को पूर्वनिर्धारित श्रेणियों के एक सेट में से किसी एक में असाइन करने का कार्य। "क्या यह ईमेल स्पैम है या नहीं?" (बाइनरी क्लासिफिकेशन)। "क्या यह छवि बिल्ली, कुत्ता या पक्षी है?" (मल्टी-क्लास)। "इस लेख पर कौन से टैग लागू होते हैं?" (मल्टी-लेबल)। Classification सबसे सामान्य सुपरवाइज़्ड लर्निंग कार्य है और अनगिनत वास्तविक-दुनिया AI अनुप्रयोगों की नींव है।

यह क्यों मायने रखता है

Classification वह जगह है जहाँ अधिकांश लोग पहली बार व्यवहार में मशीन लर्निंग से मिलते हैं — स्पैम फ़िल्टर, कंटेंट मॉडरेशन, चिकित्सा निदान, धोखाधड़ी का पता लगाना, भावना विश्लेषण। Classification को समझना आपको संपूर्ण सुपरवाइज़्ड लर्निंग पाइपलाइन को समझने में मदद करता है: लेबल किया गया डेटा अंदर, प्रशिक्षित मॉडल, भविष्यवाणियाँ बाहर।

गहन अध्ययन

एक क्लासिफ़ायर कक्षाओं पर एक प्रायिकता वितरण आउटपुट करता है। बाइनरी क्लासिफिकेशन के लिए, 0 और 1 के बीच एक एकल संख्या पर्याप्त है (पॉज़िटिव क्लास की प्रायिकता)। मल्टी-क्लास के लिए, मॉडल प्रत्येक क्लास के लिए एक प्रायिकता आउटपुट करता है, आम तौर पर softmax फ़ंक्शन का उपयोग करके यह सुनिश्चित करता है कि उनका योग 1 हो। अनुमानित क्लास आमतौर पर सबसे अधिक प्रायिकता वाली होती है, लेकिन आप false positives बनाम false negatives के प्रति अपनी सहनशीलता के आधार पर निर्णय सीमा को समायोजित कर सकते हैं।

क्लासिफ़ायर के रूप में LLMs

आधुनिक LLMs आश्चर्यजनक रूप से अच्छे क्लासिफ़ायर हैं। एक समर्पित मॉडल प्रशिक्षित करने के बजाय, आप एक LLM को प्रॉम्प्ट कर सकते हैं: "इस ग्राहक समीक्षा को सकारात्मक, नकारात्मक या तटस्थ के रूप में वर्गीकृत करें।" कई क्लासिफिकेशन कार्यों के लिए, यह ज़ीरो-शॉट दृष्टिकोण उद्देश्य-निर्मित क्लासिफ़ायर से मेल खाता है या उनसे बेहतर प्रदर्शन करता है, विशेष रूप से जब कार्य को बारीकियों या संदर्भ की समझ की आवश्यकता होती है। ट्रेड-ऑफ लागत और विलंबता है — एक LLM API कॉल स्थानीय रूप से एक छोटा क्लासिफ़ायर चलाने की तुलना में बहुत अधिक महंगा है।

मायने रखने वाली मेट्रिक्स

Accuracy (सही प्रतिशत) सबसे सहज मेट्रिक है लेकिन भ्रामक हो सकती है। यदि 99% ईमेल स्पैम नहीं हैं, तो एक मॉडल जो हमेशा "स्पैम नहीं" भविष्यवाणी करता है, 99% accuracy प्राप्त करता है लेकिन शून्य स्पैम पकड़ता है। Precision (अनुमानित positives में से, कितने सही हैं), recall (वास्तविक positives में से, कितने पाए गए) और F1 (precision और recall का हार्मोनिक माध्य) अधिक पूर्ण तस्वीर देते हैं। सही मेट्रिक आपके विशिष्ट अनुप्रयोग में त्रुटियों की लागत पर निर्भर करती है।

Classification

यह क्यों मायने रखता है

गहन अध्ययन

क्लासिफ़ायर के रूप में LLMs

मायने रखने वाली मेट्रिक्स

संबंधित अवधारणाएँ