Mistral AI 於 2023 年 4 月由 Arthur Mensch、Guillaume Lample 和 Timothée Lacroix 創立 —— 三位曾站在 AI 前沿核心的法國研究員。Mensch 來自 Google DeepMind,曾參與 Chinchilla 專案,該專案重新定義了模型最佳擴展的規則。Lample 和 Lacroix 來自 Meta 的 FAIR 實驗室,其中 Lample 是 LLaMA 的關鍵貢獻者。創業理念既大膽又具體:歐洲需要一家世界級的 AI 公司,而他們三人相信可以透過在效率上做得更聰明來實現,而非試圖在原始算力上與美國超大規模雲端業者比拚。他們在還沒推出任何產品之前就募集了 1.05 億歐元的種子輪資金 —— 歐洲科技史上最大的種子輪之一,由 Lightspeed Venture Partners 領投,顯示了市場對一個可信的歐洲 AI 競爭者有多大的渴望。
Mistral 於 2023 年 9 月的首秀堪稱高效挑釁的教科書範例。他們以 torrent 連結的方式在 Twitter 上發布了 Mistral 7B —— 沒有論文、沒有新聞稿、沒有安全審查,只有一個磁力連結和一篇簡短的部落格文章。這個模型在大多數基準測試上超越了參數量兩倍的 Llama 2 13B。這是一項宣言:Mistral 能以遠少的參數與 Meta 最好的開放模型競爭,而且他們並不太在意大型實驗室繁複的「負責任 AI 披露」慣例。Mixtral 8x7B 緊接著在 2023 年 12 月推出,這是一個稀疏混合專家模型,以遠低的推理成本達到了與 GPT-3.5 匹敵的水準。MoE 架構成為 Mistral 的標誌 —— 他們是最早證明稀疏模型既實用又高效的團隊之一,這種方法後來在整個業界被廣泛採用。這些早期發布確立了 Mistral 的品牌形象:技術卓越、文化上不按牌理出牌、且積極開放。
純開放權重的階段並沒有持續太久。到了 2024 年初,Mistral 開始提供商業 API 存取並以更嚴格的授權條款發布模型。Mistral Large,他們的旗艦專有模型,於 2024 年 2 月推出,直接與 GPT-4 和 Claude 競爭,最初同時透過 Mistral 自家的 La Plateforme API 和與 Microsoft Azure 的策略合作提供。後續的模型 —— Mistral Medium、Mistral Small,以及 Codestral(程式碼專用)和 Pixtral(視覺專用)等特化版本 —— 填補了一條旨在各價位競爭的產品線。Le Chat 是 Mistral 的消費者聊天機器人,作為對 ChatGPT 的回應推出。同時提供開放和專有模型的雙重策略引來了開源純粹主義者的批評,認為 Mistral 利用開放發布來行銷,然後就抽走了梯子,但這反映了一個現實:訓練前沿模型需要數億美元的成本,沒有一家公司能僅靠善意維持下去。
Mistral 大力發揮其歐洲身份,而不僅是品牌行銷。該公司已成為歐盟 AI 政策討論中的關鍵發聲者,倡導既不扼殺創新、也不讓歐洲公司在與美國和中國競爭者的對抗中處於劣勢的監管框架。當歐盟 AI 法案於 2023 年底進入定案階段時,Mistral(以及數個歐洲政府,尤其是法國)反對那些會對基礎模型開發者施加沉重義務的條款,主張此類規則實質上會禁止歐洲公司參與競爭。最終的妥協方案更有利於 Mistral 的立場。該公司的融資軌跡令人矚目 —— 2023 年 12 月的 A 輪 3.85 億歐元(估值約 20 億美元),接著是 2024 年 6 月的 6 億歐元,估值約 60 億美元,投資者包括 General Catalyst、Andreessen Horowitz,以及 Samsung、Salesforce 和 BNP Paribas 等策略投資者。這使 Mistral 成為歐洲史上最有價值的 AI 新創公司,也是史上最快達到數十億美元估值的公司之一。
Mistral 的核心挑戰是在沒有前沿等級預算的情況下維持前沿等級的效能。OpenAI、Google 和 Meta 各自都能砸數百億在訓練上;Mistral 做不到。他們的優勢在於架構創新和訓練效率 —— 每次浮點運算都能榨取更多能力 —— 但隨著競爭者採用類似技術,這種優勢會縮小。該公司還必須在開放權重的根基與商業化的野心之間取得平衡,而隨著模型能力越強、開放發布的安全影響越大,這種平衡會越來越難維持。DeepSeek 在 2025 年初的表現 —— 證明了一支精簡團隊靠巧妙工程就能以極低成本與前沿實驗室匹敵 —— 又增添了一個新的壓力維度。儘管如此,Mistral 集技術人才、歐洲資金支持,以及橫跨開放和商業模型的產品線於一身,使其有真正的機會成為 AI 領域持久的獨立力量 —— 這正是歐洲在過去幾波科技浪潮中明顯欠缺的。