Zubnet AIसीखेंWiki › विशेषता (Feature)
मूल तत्व

विशेषता (Feature)

इसे भी कहा जाता है: सीखा गया प्रतिनिधित्व, Activation
एक पैटर्न या अवधारणा जिसे न्यूरल नेटवर्क अपने इनपुट में पहचानना सीखता है। विज़न में, शुरुआती-परत विशेषताएँ किनारे और बनावट हैं; बाद की परत विशेषताएँ वस्तु भाग और पूर्ण वस्तुएँ हैं। भाषा मॉडल में, विशेषताएँ सरल (अक्षर "a", एक विशिष्ट वाक्य-विन्यास पैटर्न) से लेकर अमूर्त (व्यंग्य की अवधारणा, एक विशेष तर्क रणनीति) तक होती हैं। विशेषताओं को न्यूरॉनों में एक्टिवेशन पैटर्न के रूप में प्रदर्शित किया जाता है।

यह क्यों मायने रखता है

विशेषताएँ वही हैं जो मॉडल वास्तव में सीखते हैं — व्यक्तिगत तथ्य नहीं बल्कि पैटर्न जो सामान्यीकृत होते हैं। मॉडल "बिल्लियों के पास फ़र होता है" याद नहीं करता; यह फ़र जैसी बनावट के लिए एक विशेषता डिटेक्टर सीखता है जो बिल्लियों, कुत्तों, और टेडी बियर के लिए सक्रिय होता है। विशेषताओं को समझने से मॉडल व्यवहार की व्याख्या होती है: वह सामान्यीकृत क्यों करता है (विशेषताएँ स्थानांतरित होती हैं), विफल क्यों होता है (गलत विशेषता सक्रिय), और सुधार कैसे करें (अधिक विविध विशेषताओं से परिचित कराएँ)।

गहन अध्ययन

"विशेषता" शब्द का अर्थ संदर्भ के अनुसार भिन्न होता है। शास्त्रीय ML में, विशेषताएँ हाथ से इंजीनियर किए गए इनपुट चर हैं (ऊँचाई, वज़न, आयु)। डीप लर्निंग में, विशेषताएँ hidden परतों में सीखे गए प्रतिनिधित्व हैं — मॉडल स्वयं उपयोगी पैटर्न खोजता है। हाथ से इंजीनियर से सीखी गई विशेषताओं की ओर यह बदलाव डीप लर्निंग का मूल नवाचार है और यही कारण है कि यह विज़न और भाषा जैसे जटिल कार्यों पर शास्त्रीय ML से बेहतर प्रदर्शन करता है।

पदानुक्रमिक विशेषताएँ

गहरे नेटवर्क पदानुक्रमिक विशेषताएँ सीखते हैं: प्रत्येक परत पिछली पर निर्माण करती है। विज़न मॉडल में: परत 1 किनारों का पता लगाती है, परत 2 किनारों को बनावट और कोनों में संयोजित करती है, परत 3 बनावट को वस्तु भागों (आँखें, पहिये) में संयोजित करती है, परत 4 भागों को वस्तुओं (चेहरे, कारें) में संयोजित करती है। यह पदानुक्रम प्रशिक्षण से स्वचालित रूप से उभरता है — कोई इसे प्रोग्राम नहीं करता। समान पदानुक्रमिक विशेषता शिक्षण भाषा मॉडलों में भी होता है, अक्षर पैटर्न से वाक्य-विन्यास से अर्थविज्ञान से तर्क तक।

विशेषता दृश्यीकरण

शोधकर्ता यह समझने के लिए विशेषताओं को दृश्यीकृत करते हैं कि मॉडल क्या सीखते हैं। विज़न मॉडलों के लिए, आप ऐसी छवियाँ उत्पन्न कर सकते हैं जो एक विशिष्ट न्यूरॉन या दिशा को अधिकतम सक्रिय करती हैं, जिससे पता चलता है कि वह कौन सा पैटर्न पहचानता है। भाषा मॉडलों के लिए, आप वे टेक्स्ट उदाहरण खोज सकते हैं जो एक विशिष्ट विशेषता दिशा को सबसे अधिक सक्रिय करते हैं। Anthropic के शोध ने Claude में "Golden Gate Bridge," "कोड बग," "छल," और "फ्रेंच भाषा" जैसी व्याख्या योग्य अवधारणाओं को मॉडल के एक्टिवेशन स्पेस में विशिष्ट दिशाओं के रूप में एन्कोड पाया है।

संबंधित अवधारणाएँ

← सभी शब्द
← विभेदक गोपनीयता (Differential Privacy) विश्व मॉडल (World Model) →
ESC