Decart AI की स्थापना 2023 में Tel Aviv में शोधकर्ताओं की एक टीम द्वारा की गई थी जो real-time generative मॉडलों की समस्या पर काम कर रहे थे — AI सिस्टम जो केवल static आउटपुट उत्पन्न नहीं करते बल्कि सामग्री की interactive, निरंतर streams उत्पन्न करते हैं जो एक live अनुभव की तरह महसूस करने के लिए पर्याप्त तेज़ हैं। संस्थापक टीम, CEO Ido Shiraki के नेतृत्व में, computer vision, GPU optimization, और न्यूरल नेटवर्क आर्किटेक्चर में पृष्ठभूमि से आई थी, और वे एक उत्तेजक प्रश्न पर converge हुए: यदि आप एक world model को इतनी तेज़ी से चला सकते हैं कि यह पूरी तरह से एक पारंपरिक game engine को बदल दे? एक pre-rendering tool या asset generator के रूप में नहीं, बल्कि runtime के रूप में स्वयं — हर frame, हर physics interaction, खिलाड़ी इनपुट के लिए हर visual प्रतिक्रिया को real time में उत्पन्न करना। वह प्रश्न Decart की संस्थापक थीसिस बन गया और generative AI में सबसे ध्यान आकर्षित करने वाले demos में से एक का नेतृत्व किया।
2024 के अंत में, Decart ने Oasis जारी किया, एक AI मॉडल जो पूरी तरह से न्यूरल नेटवर्क inference के माध्यम से real-time में एक playable Minecraft-जैसा अनुभव उत्पन्न कर सकता था। कोई पारंपरिक game engine नहीं था, कोई pre-built world geometry नहीं, कोई physics simulation नहीं — बस एक transformer-आधारित मॉडल खिलाड़ी के इनपुट के आधार पर हर frame उत्पन्न करता था, interactive frame rates पर चलता था। Demo तुरंत viral हो गया। यह edges के आसपास खुरदरा था — visual artifacts, असंगत physics, सीमित world persistence — लेकिन मौलिक उपलब्धि निर्विवाद थी: एक न्यूरल नेटवर्क एक coherent, interactive 3D world इतनी तेज़ी से उत्पन्न कर रहा था कि आप उसमें घूम सकते थे। तकनीकी उपलब्धि के लिए असाधारण inference optimization की आवश्यकता थी, generation latency को 20+ frames प्रति सेकंड के लिए आवश्यक लगभग 50-millisecond budget तक squeeze करना। Decart ने दृष्टिकोण प्रकाशित किया और मॉडल के एक संस्करण को open-source किया, जिसने केवल चर्चा को बढ़ाया।
Decart का काम व्यापक "world model" शोध दिशा के भीतर बैठता है जिसने 2024-2025 में महत्वपूर्ण गति प्राप्त की, Meta में Yann LeCun जैसी हस्तियों द्वारा championed और Google DeepMind, Runway, और World Labs सहित कई labs द्वारा खोजा गया। मूल विचार यह है कि AI मॉडलों को इस बात का एक आंतरिक प्रतिनिधित्व सीखना चाहिए कि दुनिया कैसे काम करती है — physics, object permanence, कारण और प्रभाव — केवल static डेटा पर pattern-matching के बजाय। Decart के दृष्टिकोण को क्या विशिष्ट बनाता है वह real-time interactivity पर ज़ोर है। अधिकांश world model शोध वीडियो generation या planning पर ध्यान केंद्रित करता है, ऐसे आउटपुट उत्पन्न करता है जिन्हें आप interact करने के बजाय देखते हैं। Decart के मॉडल निरंतर इनपुट का जवाब देने के लिए डिज़ाइन किए गए हैं, जो उन्हें वीडियो generators की तुलना में game engines के अधिक समान बनाते हैं। यह interactive आयाम तकनीकी रूप से बहुत अधिक माँग वाला है लेकिन gaming, simulation, training, और रोबोटिक्स में applications के लिए कहीं अधिक commercially दिलचस्प भी है।
Decart ने 2024 में $21 मिलियन की seed funding जुटाई, Sequoia Capital के नेतृत्व में और Nvidia की venture शाखा सहित उल्लेखनीय निवेशकों की भागीदारी के साथ। एक seed round के लिए, यह पर्याप्त था, world model space के लिए निवेशक उत्साह और Oasis demo के viral प्रभाव को दर्शाता है। कंपनी की तत्काल तकनीकी चुनौती "प्रभावशाली demo" और "production-quality अनुभव" के बीच का अंतर बंद करना है — उत्पन्न दुनिया को बेहतर एकरूपता, लंबी coherence windows, और उस तरह की visual निष्ठा की आवश्यकता है जिसकी खिलाड़ियों और उपयोगकर्ताओं को आधुनिक game engines से अपेक्षा है। दीर्घकालिक अवसर gaming से कहीं बड़ा है: real-time world simulation में स्वायत्त वाहन प्रशिक्षण, रोबोटिक manipulation, स्थापत्य visualization, और किसी भी डोमेन में applications हैं जहाँ आपको fly पर यथार्थवादी interactive वातावरण उत्पन्न करने की आवश्यकता होती है। यदि Decart अपने inference को पर्याप्त तेज़ और अपने आउटपुट को पर्याप्त विश्वसनीय बना सकता है, तो वे AI-native interactive media की एक पूरी तरह से नई श्रेणी को परिभाषित कर सकते हैं।