Mistral AI की स्थापना अप्रैल 2023 में Arthur Mensch, Guillaume Lample और Timothée Lacroix ने की — तीन फ्रांसीसी शोधकर्ता जो AI के अग्रिम मोर्चे के बिल्कुल केंद्र में रहे थे। Mensch Google DeepMind से आए थे, जहाँ उन्होंने Chinchilla परियोजना पर काम किया था जिसने इष्टतम मॉडल स्केलिंग के नियमों को फिर से लिखा। Lample और Lacroix Meta के FAIR लैब से आए थे, जहाँ Lample LLaMA के एक प्रमुख योगदानकर्ता थे। संस्थापक थीसिस महत्वाकांक्षी और विशिष्ट थी: यूरोप को एक विश्व स्तरीय AI कंपनी की आवश्यकता थी, और इन तीनों का मानना था कि वे कच्चे कंप्यूट पर अमेरिकी हाइपरस्केलर्स को मात देने की कोशिश के बजाय दक्षता के बारे में अधिक चतुर होकर इसे बना सकते हैं। एक भी उत्पाद शिप करने से पहले उन्होंने €105 मिलियन की सीड फंडिंग जुटाई — यूरोपीय तकनीकी इतिहास में सबसे बड़े सीड राउंड में से एक, जिसका नेतृत्व Lightspeed Venture Partners ने किया, और AI की दौड़ में एक विश्वसनीय यूरोपीय दावेदार के लिए कितनी भूख थी इसका संकेत।
Mistral की शुरुआत, सितंबर 2023 में, कुशल उत्तेजना का एक मास्टरक्लास थी। उन्होंने Mistral 7B को Twitter पर एक टोरेंट लिंक के रूप में जारी किया — कोई पेपर नहीं, कोई प्रेस विज्ञप्ति नहीं, कोई सुरक्षा समीक्षा नहीं, बस एक मैगनेट लिंक और एक संक्षिप्त ब्लॉग पोस्ट। मॉडल ने आधे आकार के बावजूद अधिकांश बेंचमार्क पर Llama 2 13B को पीछे छोड़ दिया। यह एक बयान था: Mistral पैरामीटर के एक अंश के साथ Meta के सर्वश्रेष्ठ ओपन मॉडल से प्रतिस्पर्धा कर सकता है, और उन्हें ज़िम्मेदार AI प्रकटीकरण की उन परंपराओं की ज्यादा परवाह नहीं थी जिन्हें बड़ी लैब बड़े प्रयास से प्रदर्शित कर रही थीं। Mixtral 8x7B दिसंबर 2023 में आया, एक स्पार्स Mixture of Experts मॉडल जो इन्फ़ेरेंस लागत के एक अंश पर GPT-3.5 के बराबर था। MoE आर्किटेक्चर एक Mistral हस्ताक्षर बन गया — वे यह प्रदर्शित करने वाले पहले लोगों में से थे कि स्पार्स मॉडल व्यावहारिक और प्रदर्शनकारी दोनों हो सकते हैं, एक दृष्टिकोण जिसे तब से पूरे उद्योग में अपनाया गया है। इन शुरुआती रिलीज़ ने Mistral की ब्रांड पहचान स्थापित की: तकनीकी रूप से उत्कृष्ट, सांस्कृतिक रूप से विद्रोही, और आक्रामक रूप से ओपन।
केवल-ओपन-वेट्स वाला चरण ज्यादा देर तक नहीं चला। 2024 की शुरुआत तक, Mistral ने वाणिज्यिक API एक्सेस की पेशकश शुरू कर दी और अधिक प्रतिबंधात्मक लाइसेंस के तहत मॉडल जारी किए। Mistral Large, उनका फ्लैगशिप प्रोप्राइटरी मॉडल, फरवरी 2024 में GPT-4 और Claude के सीधे प्रतिस्पर्धी के रूप में लॉन्च हुआ, शुरुआत में Mistral की अपनी La Plateforme API और Microsoft Azure के साथ एक रणनीतिक साझेदारी दोनों के माध्यम से उपलब्ध। बाद के मॉडल — Mistral Medium, Mistral Small, और Codestral (कोड के लिए) तथा Pixtral (विज़न के लिए) जैसे विशेष वेरिएंट — ने हर मूल्य बिंदु पर प्रतिस्पर्धा करने के लिए डिज़ाइन की गई एक उत्पाद लाइनअप को भर दिया। Le Chat, Mistral का उपभोक्ता चैटबॉट, ChatGPT के लिए कंपनी के उत्तर के रूप में लॉन्च हुआ। ओपन और प्रोप्राइटरी मॉडलों की दोहरी रणनीति ने ओपन-सोर्स शुद्धतावादियों से कुछ आलोचना खींची जो महसूस करते थे कि Mistral ने सीढ़ी ऊपर खींचने से पहले मार्केटिंग के लिए ओपन रिलीज़ का उपयोग किया था, लेकिन यह एक व्यावहारिक वास्तविकता को दर्शाता है: फ्रंटियर मॉडलों को प्रशिक्षित करने में सैकड़ों मिलियन डॉलर खर्च होते हैं, और कोई भी कंपनी इसे केवल सद्भावना पर बनाए नहीं रख सकती।
Mistral ने अपनी यूरोपीय पहचान पर भारी झुकाव दिखाया है, और केवल ब्रांडिंग के लिए नहीं। कंपनी EU AI नीति चर्चाओं में एक प्रमुख आवाज़ बन गई है, ऐसे नियामक ढाँचों के लिए वकालत करती है जो नवाचार को नहीं दबाते या यूरोपीय कंपनियों को अमेरिकी और चीनी प्रतिस्पर्धियों के मुकाबले नुकसान में नहीं डालते। जब EU AI Act को 2023 के अंत में अंतिम रूप दिया जा रहा था, Mistral (कई यूरोपीय सरकारों, विशेष रूप से फ्रांस के साथ) ने उन प्रावधानों के खिलाफ धक्का दिया जो फाउंडेशन मॉडल डेवलपर्स पर भारी दायित्व लगाते, यह तर्क देते हुए कि ऐसे नियम प्रभावी रूप से यूरोपीय कंपनियों को प्रतिस्पर्धा करने से रोक देंगे। परिणामी समझौते Mistral की स्थिति के लिए अधिक अनुकूल थे। कंपनी का फंडरेज़िंग प्रक्षेपवक्र असाधारण रहा है — दिसंबर 2023 में €385 मिलियन की Series A (मूल्यांकन लगभग $2 बिलियन), उसके बाद जून 2024 में €600 मिलियन का राउंड जिसने कंपनी का मूल्यांकन लगभग $6 बिलियन किया, जिसमें General Catalyst, Andreessen Horowitz, और Samsung, Salesforce तथा BNP Paribas जैसे रणनीतिक समर्थक शामिल थे। इसने Mistral को यूरोपीय इतिहास में सबसे मूल्यवान AI स्टार्टअप और बहु-अरब डॉलर के मूल्यांकन तक पहुँचने वाली सबसे तेज़ कंपनियों में से एक बना दिया।
Mistral की मूल चुनौती फ्रंटियर बजट के बिना फ्रंटियर प्रदर्शन को बनाए रखना है। OpenAI, Google, और Meta प्रत्येक प्रशिक्षण रन पर दसियों अरब डॉलर फेंक सकते हैं; Mistral नहीं कर सकता। उनकी बढ़त वास्तुकला नवाचार और प्रशिक्षण दक्षता रही है — प्रति FLOP अधिक क्षमता प्राप्त करना — लेकिन वह लाभ संकीर्ण होता जाता है क्योंकि प्रतिस्पर्धी समान तकनीकों को अपनाते हैं। कंपनी को अपनी ओपन-वेट्स जड़ों और वाणिज्यिक महत्वाकांक्षाओं के बीच के तनाव को भी नेविगेट करना पड़ा है, एक संतुलन जो मॉडलों के अधिक सक्षम होने और ओपन रिलीज़ के सुरक्षा निहितार्थ अधिक परिणामी होने के साथ कठिन होता जाता है। DeepSeek से प्रतिस्पर्धा, जिसने 2025 की शुरुआत में प्रदर्शित किया कि चतुर इंजीनियरिंग वाली एक दुबली टीम लागत के एक अंश पर फ्रंटियर लैब का सामना कर सकती है, ने दबाव का एक और आयाम जोड़ा। फिर भी, Mistral का तकनीकी प्रतिभा, यूरोपीय समर्थन, और एक उत्पाद लाइनअप जो ओपन तथा वाणिज्यिक मॉडलों दोनों में फैला है — इन सबका संयोजन इसे AI में एक टिकाऊ, स्वतंत्र शक्ति बनने का एक वास्तविक मौका देता है — कुछ ऐसा जिसकी पिछली तकनीकी लहरों में यूरोप में स्पष्ट रूप से कमी रही है।