रेका की स्थापना 2023 में डानी योगातमा, यी टैय और चें ज़ेंग द्वारा की गई थी — अनुसंधानकर्ताओं जिनका संयुक्त पृष्ठभूमि भूमि बर्बरता के बराबर बड़े एआई लैब्स के एक पर्यटन के तौर पर पढ़ा जा सकता है। योगातमा ने डीपमाइंड में कई साल बरते जहां उन्होंने भाषा समझ और तर्क पर काम किया। यी टैय गूगल ब्रेन (बाद में गूगल डीपमाइंड) में एक वरिष्ठ अनुसंधानकर्ता रहे थे, जिनके काम के लिए उनकी जानकारी अधिक कुशल ट्रांसफॉर्मर्स, स्केलिंग कानून और यूएल2 एकीकृत भाषा सीखने वाले पर थी। ज़ेंग ने बड़े पैमाने पर प्रणालियों के निर्माण से गहरी इंजीनियरिंग विशेषज्ञता लाई। स्थापना के सिद्धांत सीधा लेकिन उत्साहजनक था: अगली पीढ़ी के एआई मॉडल बाद में बहुमाध्यमी क्षमताओं को जोड़े नहीं चाहिए। बल्कि, वे शुरू से ही बहुमाध्यमी होना चाहिए — एक एकीकृत आर्किटेक्चर में पाठ, छवि, वीडियो और ऑडियो को प्रक्रमित करने के लिए जमीन से ऊपर तक प्रशिक्षित। उस विश्वास ने शुरुआती वित्तीय संसाधन और एक अनुसंधानकर्ताओं की टीम को आकर्षित किया जो अधिकांश लैब्स द्वारा उपयोग किए जाने वाले "बाद में दृश्य जोड़ें" प्रयोजन के लिए मूल रूप से सीमित होने के विश्वास के साथ विश्वास करते थे।
रेका द्वारा तकनीकी अंतर उन मॉडलों के बीच है जो "बहुमाध्यमी" हैं क्योंकि किसी ने एक पाठ मॉडल पर एक दृश्य एंकोडर को फाइन-ट्यून किया था, और उन मॉडलों के बीच जो बहुमाध्यमी हैं क्योंकि अनेक माध्यमों को प्रशिक्षण के शुरुआत से ही एकीकृत किया गया था। उनके प्रमुख मॉडलों — रेका कोर, रेका फ्लैश और छोटे रेका एज — को विशेष रूप से टेक्स्ट, छवि, वीडियो और ऑडियो को प्रक्रमित करने के लिए डिज़ाइन किया गया था। यह केवल एक विज्ञापन दावा नहीं है; यह वीडियो समझ में दिखाई देता है, जहां मॉडल समय अनुक्रमों पर तर्क कर सकता है बजाय केवल व्यक्तिगत फ्रेम के लेबल लगाने के। रेका फ्लैश, उनका मध्यम आकार का मॉडल, बहुमाध्यमी परीक्षणों में अपने भार के बावजूद बेहतर प्रदर्शन करने के लिए ध्यान देने योग्य बन गया, अक्सर अपने पैरामीटर काउंट के कई गुना बड़े मॉडलों के बराबर या उससे अधिक अंक प्राप्त करता है। टीम ने अप्रैल 2024 में अपनी तकनीकी रिपोर्ट प्रकाशित की, जिसमें विभिन्न कार्यों में जीपीटी-4वी, जेमिनी प्रो और क्लॉड 3 सोनेट के खिलाफ प्रतिस्पर्धी परिणाम दिखाए गए — एक अद्भुत उपलब्धि एक कंपनी के लिए जो लगभग एक साल पुरानी थी।
रेका ने 2024 में डीएसटी ग्लोबल और रेडिकल वेंचर्स द्वारा नेतृत्व वाले 58 मिलियन डॉलर के ए सीरीज फंडिंग एकत्र की, जिसमें सॉफ्टबैंक और प्रमुख एंजेल निवेशकों की भागीदारी थी। एआई लैब के मानकों के अनुसार, यह छोटा है — वह पैसा जो आपको कुछ महीनों के गंभीर GPU समय के लिए खरीदता है, न कि बिलियन डॉलर के युद्ध कोष जो ओपनएआई, एंथ्रोपिक और xAI ने एकत्र किए हैं। रेका ने अपनी दक्षता के लिए असाधारण रूप से छोटे रहे: उनकी टीम अपने पहले वर्ष के अधिकांश समय के लिए 30 लोगों से कम रही, उनके मॉडलों को ध्यान से कम्प्यूटेशन बजटिंग के साथ प्रशिक्षित किया गया था, और वे त्वरित रूप से उत्पाद लॉन्च कर दिए। उन्होंने एक API और एक उपभोक्ता-मुखी सहायक के रूप में रेका प्लेग्राउंड लॉन्च किया, लेकिन वास्तव में खेल हमेशा मॉडलों के आसपास रहा है — विकासकर्ताओं और उद्यमों के लिए अग्रणी वर्ग के बहुमाध्यमी एआई की पेशकश करते हुए जिन्हें