Reka: परिभाषा और अर्थ — AI विकी

एआई रिसर्च कंपनी जो पूर्व DeepMind, Google Brain और FAIR के अनुसंधानकर्ताओं द्वारा स्थापित की गई है। मूल से बनाए गए पोलीमोडल मॉडल जो पाठ, छवियाँ, वीडियो और ऑडियो की प्रक्रिया कर सकते हैं।

यह क्यों मायने रखता है

रीका ने दिखाया कि एक छोटी, अनुसंधान-केंद्रित टीम जिसके पास सही पृष्ठभूमि हो, बिलियन डॉलर के फंडिंग के बिना फ्रंटियर-क्लास बहुमाध्यम मॉडल बना सकती है — और वह स्वाभाविक रूप से बहुमाध्यम आर्किटेक्चर जो शून्य से प्रशिक्षित किया गया है, अधिकांश बड़े प्रयोगशालाओं द्वारा उपयोग किए जाने वाले बोल्टेड-ऑन प्रयोग की तुलना में बेहतर प्रदर्शन कर सकते हैं। उनके स्थापना से स्नोफ्लेक के अधिग्रहण तक के तेजी से विकास ने यह भी खुलासा कर दिया कि अब उद्यम डेटा प्लेटफॉर्म एआई टैलेंट पर तीव्र गुरुत्वाकर्षण की खींच लगा रहे हैं, जो सुझाता है कि बहुमाध्यम एआई का भविष्य डेटा इन्फ्रास्ट्रक्चर कंपनियों के अंदर हो सकता है, बजाय अलग-अलग अनुसंधान प्रयोगशालाओं के।

गहन अध्ययन

रेका की स्थापना 2023 में डानी योगातमा, यी टैय और चें ज़ेंग द्वारा की गई थी — अनुसंधानकर्ताओं जिनका संयुक्त पृष्ठभूमि भूमि बर्बरता के बराबर बड़े एआई लैब्स के एक पर्यटन के तौर पर पढ़ा जा सकता है। योगातमा ने डीपमाइंड में कई साल बरते जहां उन्होंने भाषा समझ और तर्क पर काम किया। यी टैय गूगल ब्रेन (बाद में गूगल डीपमाइंड) में एक वरिष्ठ अनुसंधानकर्ता रहे थे, जिनके काम के लिए उनकी जानकारी अधिक कुशल ट्रांसफॉर्मर्स, स्केलिंग कानून और यूएल2 एकीकृत भाषा सीखने वाले पर थी। ज़ेंग ने बड़े पैमाने पर प्रणालियों के निर्माण से गहरी इंजीनियरिंग विशेषज्ञता लाई। स्थापना के सिद्धांत सीधा लेकिन उत्साहजनक था: अगली पीढ़ी के एआई मॉडल बाद में बहुमाध्यमी क्षमताओं को जोड़े नहीं चाहिए। बल्कि, वे शुरू से ही बहुमाध्यमी होना चाहिए — एक एकीकृत आर्किटेक्चर में पाठ, छवि, वीडियो और ऑडियो को प्रक्रमित करने के लिए जमीन से ऊपर तक प्रशिक्षित। उस विश्वास ने शुरुआती वित्तीय संसाधन और एक अनुसंधानकर्ताओं की टीम को आकर्षित किया जो अधिकांश लैब्स द्वारा उपयोग किए जाने वाले "बाद में दृश्य जोड़ें" प्रयोजन के लिए मूल रूप से सीमित होने के विश्वास के साथ विश्वास करते थे।

डिज़ाइन के अनुसार बहुमाध्यमी

रेका द्वारा तकनीकी अंतर उन मॉडलों के बीच है जो "बहुमाध्यमी" हैं क्योंकि किसी ने एक पाठ मॉडल पर एक दृश्य एंकोडर को फाइन-ट्यून किया था, और उन मॉडलों के बीच जो बहुमाध्यमी हैं क्योंकि अनेक माध्यमों को प्रशिक्षण के शुरुआत से ही एकीकृत किया गया था। उनके प्रमुख मॉडलों — रेका कोर, रेका फ्लैश और छोटे रेका एज — को विशेष रूप से टेक्स्ट, छवि, वीडियो और ऑडियो को प्रक्रमित करने के लिए डिज़ाइन किया गया था। यह केवल एक विज्ञापन दावा नहीं है; यह वीडियो समझ में दिखाई देता है, जहां मॉडल समय अनुक्रमों पर तर्क कर सकता है बजाय केवल व्यक्तिगत फ्रेम के लेबल लगाने के। रेका फ्लैश, उनका मध्यम आकार का मॉडल, बहुमाध्यमी परीक्षणों में अपने भार के बावजूद बेहतर प्रदर्शन करने के लिए ध्यान देने योग्य बन गया, अक्सर अपने पैरामीटर काउंट के कई गुना बड़े मॉडलों के बराबर या उससे अधिक अंक प्राप्त करता है। टीम ने अप्रैल 2024 में अपनी तकनीकी रिपोर्ट प्रकाशित की, जिसमें विभिन्न कार्यों में जीपीटी-4वी, जेमिनी प्रो और क्लॉड 3 सोनेट के खिलाफ प्रतिस्पर्धी परिणाम दिखाए गए — एक अद्भुत उपलब्धि एक कंपनी के लिए जो लगभग एक साल पुरानी थी।

एक वित्तीय रूप से भारी क्षेत्र में एक छोटी संचालन इकाई

रेका ने 2024 में डीएसटी ग्लोबल और रेडिकल वेंचर्स द्वारा नेतृत्व वाले 58 मिलियन डॉलर के ए सीरीज फंडिंग एकत्र की, जिसमें सॉफ्टबैंक और प्रमुख एंजेल निवेशकों की भागीदारी थी। एआई लैब के मानकों के अनुसार, यह छोटा है — वह पैसा जो आपको कुछ महीनों के गंभीर GPU समय के लिए खरीदता है, न कि बिलियन डॉलर के युद्ध कोष जो ओपनएआई, एंथ्रोपिक और xAI ने एकत्र किए हैं। रेका ने अपनी दक्षता के लिए असाधारण रूप से छोटे रहे: उनकी टीम अपने पहले वर्ष के अधिकांश समय के लिए 30 लोगों से कम रही, उनके मॉडलों को ध्यान से कम्प्यूटेशन बजटिंग के साथ प्रशिक्षित किया गया था, और वे त्वरित रूप से उत्पाद लॉन्च कर दिए। उन्होंने एक API और एक उपभोक्ता-मुखी सहायक के रूप में रेका प्लेग्राउंड लॉन्च किया, लेकिन वास्तव में खेल हमेशा मॉडलों के आसपास रहा है — विकासकर्ताओं और उद्यमों के लिए अग्रणी वर्ग के बहुमाध्यमी एआई की पेशकश करते हुए जिन्हें

Reka

यह क्यों मायने रखता है

गहन अध्ययन

डिज़ाइन के अनुसार बहुमाध्यमी

एक वित्तीय रूप से भारी क्षेत्र में एक छोटी संचालन इकाई

संबंधित अवधारणाएँ