Zubnet AIसीखेंWiki › Hume
कंपनियाँ

Hume

इसे भी कहा जाता है: सहानुभूतिक वॉयस इंटरफ़ेस, भावना पहचान
एआई कंपनी जो मॉडल बनाती है जो मनुष्यी भावना को समझ सकते हैं और अभिव्यक्त कर सकते हैं। उनका एम्पैथिक वॉइस इंटरफेस वास्तविक समय में टोन, संवेदना और भावात्मक संदर्भ का पता लगाता है, जिससे एआई संवाद न केवल आपके कहे वाले शब्दों के लिए प्रतिक्रिया देते हैं बल्कि आपके कहने के तरीके के लिए भी।

यह क्यों मायने रखता है

ह्यूम महत्वपूर्ण है क्योंकि वे आधुनिक AI में सबसे चमकदार अंधापन को ध्यान में रखते हैं: भावनात्मक समझ। आज के हर चैटबॉट, वॉइस असिस्टेंट और AI एजेंट वास्तव में टोन-डेफ होते हैं, शब्दों के लिखित मान के उत्तर देते हैं जबकि मनुष्यों द्वारा अनुभूत भावनात्मक संदर्भ को नजरअंदाज करते हैं। ह्यूम के Empathic Voice Interface उत्पादन पैमाने पर उस अंतर को भरने के लिए पहला गंभीर प्रयास है, और भावनात्मक AI के लिए नैतिक दिशा-निर्देशों पर उनकी जोड़े बांधने के लिए एक मानक स्थापित करता है जिसे उद्योग अंततः अपनाने के लिए मजबूर होगा।

गहन अध्ययन

ह्यूम एआई की स्थापना 2021 में एलन कोवेन द्वारा की गई थी, जो गूगल के पूर्व अनुसंधानकर्ता थे जिन्होंने यूसी बर्कले और गूगल में भावना के विज्ञान के अध्ययन में कई साल बिताए थे। कोवेन के अकादमिक कार्य ने मानव भावनात्मक अभिव्यक्ति को अद्भुत विस्तार से मैप किया था — उनकी अनुसंधान ने 28 से अधिक विशिष्ट ध्वनि भावना श्रेणियों की पहचान की थी और उन पर मॉडल के प्रशिक्षण के लिए बड़े पैमाने पर डेटा सेट बनाए थे। ह्यूम उस अनुसंधान के व्यावसायिकरण था, जो एक अनुमान पर बना था कि अधिकांश एआई पूरी तरह से उपेक्षा करते हैं: कुछ कहे जाने के तरीके के बराबर ही उसके बारे में कहे जाने के महत्व होता है। कंपनी न्यूयॉर्क में स्थित है और निवेशकों और नैतिकता विशेषज्ञों से गंभीर ध्यान आकर्षित कर चुकी है।

एम्पैथिक वॉइस इंटरफेस

ह्यूम के प्रमुख उत्पाद एम्पैथिक वॉइस इंटरफेस (ईवीआई) है, एक वॉइस एआई प्रणाली जो शब्दों के लिए नहीं बल्कि प्रोसोडी, टोन, पीड़न और ध्वनि टेक्सचर में भावनात्मक सामग्री के अंकित किए गए लिए सुनता है। ईवीआई वास्तविक समय में दर्जनों भावनात्मक स्थितियों का पता लगा सकता है — असंतोष, मनोरंजन, भ्रम, आत्मविश्वास, संदेह — और उस समझ का उपयोग अपने उत्तरों के लिए अपनी आवाज को समायोजित करने के लिए कर सकता है। व्यावहार में, यह अर्थ है कि ईवीआई द्वारा संचालित एक एआई एजेंट उपयोगकर्ता के असंतोष के बारे में ध्यान दे सकता है और अपने टोन को समायोजित कर सकता है, धीमा हो सकता है या मनुष्य के पास बढ़ावा देने के लिए प्रस्ताव दे सकता है। यह जान सकता है कि कोई भ्रमित है और बिना पूछे फिर से व्याख्या कर सकता है। यह भावना विश्लेषण एक पोस्ट-प्रोसेसिंग कदम के रूप में जोड़ा गया नहीं है; भावना समझ नमूना के मुख्य अनुमान लूप में बुना गया है।

उत्पाद के पीछे विज्ञान

ह्यूम को असामान्य विश्वास देने वाली बात यह है कि इसके पीछे विज्ञान की गहराई है। कोवेन ने कंपनी की स्थापना के पहले भावना प्रत्यय पर व्यापक रूप से लेखन किया था, और ह्यूम के मॉडल ऐसे डेटा सेट पर प्रशिक्षित किए गए हैं जो कड़े एनोटेशन प्रोटोकॉल के साथ बनाए गए थे — मैकेनिकल टर्क से बाहर के लेबल नहीं, बल्कि अंतर-सांस्कृतिक भावनात्मक अभिव्यक्ति को पकड़ने के लिए डिज़ाइन किए गए संरचित मूल्यांकन। कंपनी के अभिव्यक्ति मापन API चेहरे के अभिव्यक्ति, ध्वनि बर्स्ट (हंसी, सांस लेना, आश्चर्य) और बोली के प्रोसोडी के साथ एक साथ विश्लेषण कर सकता है, जो भावनात्मक स्थिति के बहु-मोडल चित्र के बनाता है। उन्होंने यह अपने अनुसंधान प्रकाशित किया है कि भावना मॉडल कैसे विभिन्न जाति वर्गों में न्यायसंगत रूप से मूल्यांकित किए जा सकते हैं, जो एक तकनीक के लिए अत्यधिक महत्वपूर्ण है जो आसानी से "क्रोध" या "खुशी" के ध्वनि के बारे में सांस्कृतिक बायस को एनकोड कर सकता है।

नैतिकता के रूप में वास्तुकला

ह्यूम भावना एआई के उपयोग के लिए असामान्य रूप से सिद्धांत पर आधारित दृष्टिकोण अपनाता है। उन्होंने ह्यूम इनिशिएटिव प्रकाशित किया है, एक नैतिक निर्देशों का सेट जो कंपनी ने अपने व्यावसायिक उत्पादों के लॉन्च के पहले अनुसंधानकर्त

संबंधित अवधारणाएँ

← सभी शब्द
← HiDream हाइपरपैरामीटर →
ESC