Zubnet AIसीखेंWiki › Reka
कंपनियाँ

Reka

इसे भी कहा जाता है: Reka Core, Reka Flash
एआई रिसर्च कंपनी जो पूर्व DeepMind, Google Brain और FAIR के अनुसंधानकर्ताओं द्वारा स्थापित की गई है। मूल से बनाए गए पोलीमोडल मॉडल जो पाठ, छवियाँ, वीडियो और ऑडियो की प्रक्रिया कर सकते हैं।

यह क्यों मायने रखता है

रीका ने दिखाया कि एक छोटी, अनुसंधान-केंद्रित टीम जिसके पास सही पृष्ठभूमि हो, बिलियन डॉलर के फंडिंग के बिना फ्रंटियर-क्लास बहुमाध्यम मॉडल बना सकती है — और वह स्वाभाविक रूप से बहुमाध्यम आर्किटेक्चर जो शून्य से प्रशिक्षित किया गया है, अधिकांश बड़े प्रयोगशालाओं द्वारा उपयोग किए जाने वाले बोल्टेड-ऑन प्रयोग की तुलना में बेहतर प्रदर्शन कर सकते हैं। उनके स्थापना से स्नोफ्लेक के अधिग्रहण तक के तेजी से विकास ने यह भी खुलासा कर दिया कि अब उद्यम डेटा प्लेटफॉर्म एआई टैलेंट पर तीव्र गुरुत्वाकर्षण की खींच लगा रहे हैं, जो सुझाता है कि बहुमाध्यम एआई का भविष्य डेटा इन्फ्रास्ट्रक्चर कंपनियों के अंदर हो सकता है, बजाय अलग-अलग अनुसंधान प्रयोगशालाओं के।

गहन अध्ययन

रेका की स्थापना 2023 में डानी योगातमा, यी टैय और चें ज़ेंग द्वारा की गई थी — अनुसंधानकर्ताओं जिनका संयुक्त पृष्ठभूमि भूमि बर्बरता के बराबर बड़े एआई लैब्स के एक पर्यटन के तौर पर पढ़ा जा सकता है। योगातमा ने डीपमाइंड में कई साल बरते जहां उन्होंने भाषा समझ और तर्क पर काम किया। यी टैय गूगल ब्रेन (बाद में गूगल डीपमाइंड) में एक वरिष्ठ अनुसंधानकर्ता रहे थे, जिनके काम के लिए उनकी जानकारी अधिक कुशल ट्रांसफॉर्मर्स, स्केलिंग कानून और यूएल2 एकीकृत भाषा सीखने वाले पर थी। ज़ेंग ने बड़े पैमाने पर प्रणालियों के निर्माण से गहरी इंजीनियरिंग विशेषज्ञता लाई। स्थापना के सिद्धांत सीधा लेकिन उत्साहजनक था: अगली पीढ़ी के एआई मॉडल बाद में बहुमाध्यमी क्षमताओं को जोड़े नहीं चाहिए। बल्कि, वे शुरू से ही बहुमाध्यमी होना चाहिए — एक एकीकृत आर्किटेक्चर में पाठ, छवि, वीडियो और ऑडियो को प्रक्रमित करने के लिए जमीन से ऊपर तक प्रशिक्षित। उस विश्वास ने शुरुआती वित्तीय संसाधन और एक अनुसंधानकर्ताओं की टीम को आकर्षित किया जो अधिकांश लैब्स द्वारा उपयोग किए जाने वाले "बाद में दृश्य जोड़ें" प्रयोजन के लिए मूल रूप से सीमित होने के विश्वास के साथ विश्वास करते थे।

डिज़ाइन के अनुसार बहुमाध्यमी

रेका द्वारा तकनीकी अंतर उन मॉडलों के बीच है जो "बहुमाध्यमी" हैं क्योंकि किसी ने एक पाठ मॉडल पर एक दृश्य एंकोडर को फाइन-ट्यून किया था, और उन मॉडलों के बीच जो बहुमाध्यमी हैं क्योंकि अनेक माध्यमों को प्रशिक्षण के शुरुआत से ही एकीकृत किया गया था। उनके प्रमुख मॉडलों — रेका कोर, रेका फ्लैश और छोटे रेका एज — को विशेष रूप से टेक्स्ट, छवि, वीडियो और ऑडियो को प्रक्रमित करने के लिए डिज़ाइन किया गया था। यह केवल एक विज्ञापन दावा नहीं है; यह वीडियो समझ में दिखाई देता है, जहां मॉडल समय अनुक्रमों पर तर्क कर सकता है बजाय केवल व्यक्तिगत फ्रेम के लेबल लगाने के। रेका फ्लैश, उनका मध्यम आकार का मॉडल, बहुमाध्यमी परीक्षणों में अपने भार के बावजूद बेहतर प्रदर्शन करने के लिए ध्यान देने योग्य बन गया, अक्सर अपने पैरामीटर काउंट के कई गुना बड़े मॉडलों के बराबर या उससे अधिक अंक प्राप्त करता है। टीम ने अप्रैल 2024 में अपनी तकनीकी रिपोर्ट प्रकाशित की, जिसमें विभिन्न कार्यों में जीपीटी-4वी, जेमिनी प्रो और क्लॉड 3 सोनेट के खिलाफ प्रतिस्पर्धी परिणाम दिखाए गए — एक अद्भुत उपलब्धि एक कंपनी के लिए जो लगभग एक साल पुरानी थी।

एक वित्तीय रूप से भारी क्षेत्र में एक छोटी संचालन इकाई

रेका ने 2024 में डीएसटी ग्लोबल और रेडिकल वेंचर्स द्वारा नेतृत्व वाले 58 मिलियन डॉलर के ए सीरीज फंडिंग एकत्र की, जिसमें सॉफ्टबैंक और प्रमुख एंजेल निवेशकों की भागीदारी थी। एआई लैब के मानकों के अनुसार, यह छोटा है — वह पैसा जो आपको कुछ महीनों के गंभीर GPU समय के लिए खरीदता है, न कि बिलियन डॉलर के युद्ध कोष जो ओपनएआई, एंथ्रोपिक और xAI ने एकत्र किए हैं। रेका ने अपनी दक्षता के लिए असाधारण रूप से छोटे रहे: उनकी टीम अपने पहले वर्ष के अधिकांश समय के लिए 30 लोगों से कम रही, उनके मॉडलों को ध्यान से कम्प्यूटेशन बजटिंग के साथ प्रशिक्षित किया गया था, और वे त्वरित रूप से उत्पाद लॉन्च कर दिए। उन्होंने एक API और एक उपभोक्ता-मुखी सहायक के रूप में रेका प्लेग्राउंड लॉन्च किया, लेकिन वास्तव में खेल हमेशा मॉडलों के आसपास रहा है — विकासकर्ताओं और उद्यमों के लिए अग्रणी वर्ग के बहुमाध्यमी एआई की पेशकश करते हुए जिन्हें

संबंधित अवधारणाएँ

← सभी शब्द
← रीइन्फ़ोर्समेंट लर्निंग Resemble AI →
ESC