Mistral证明了,你不需要美国超大规模云服务商的预算来构建前沿AI模型。他们的高效架构——尤其是早期在稀疏Mixture of Experts方面的研究——影响了整个行业对模型设计的思路,并通过开源权重发布,让全球开发者无需依赖API即可访问高质量模型。作为首家达到真正前沿竞争水平的欧洲AI公司,Mistral还具有战略意义:他们的成功(或失败)将决定欧洲能否成为AI领域的参与者,而不仅仅是监管者。
Mistral AI 于 2023 年 4 月由 Arthur Mensch、Guillaume Lample 和 Timothée Lacroix 创立——三位曾处于 AI 前沿核心的法国研究人员。Mensch 来自 Google DeepMind,曾参与 Chinchilla 项目,该项目重新定义了最优模型扩展的规则。Lample 和 Lacroix 来自 Meta 的 FAIR 实验室,其中 Lample 是 LLaMA 的关键贡献者。创始理念雄心勃勃且具体:欧洲需要一家世界级的 AI 公司,而这三人相信,通过更注重效率而非试图在原始计算上与美国超大规模公司竞争,他们能够建立这样的公司。在推出任何产品之前,他们就筹集了 1.05 亿欧元的种子资金——这是欧洲科技史上最大的种子轮融资之一,由 Lightspeed Venture Partners 领投,也表明了人们对欧洲在 AI 竞赛中成为可信竞争者的强烈需求。
Mistral 于 2023 年 9 月的首次亮相堪称高效挑衅的典范。他们通过 Twitter 以 torrent 链接形式发布了 Mistral 7B——没有论文、没有新闻稿、没有安全审查,只有磁力链接和一篇简短的博客文章。尽管模型参数仅为 Llama 2 13B 的一半,但在大多数基准测试中表现更优。这是一个明确的信号:Mistral 可以用极少的参数与 Meta 最佳的开源模型竞争,而且他们并不太在意大型实验室所费力执行的负责任 AI 披露惯例。2023 年 12 月,Mixtral 8x7B 紧随其后,这是一种稀疏的专家混合模型,其推理成本仅为 GPT-3.5 的一小部分,却能与之媲美。MoE 架构成为 Mistral 的标志性技术——他们是最早证明稀疏模型既实用又高效的企业之一,这一方法此后被整个行业广泛采用。这些早期发布确立了 Mistral 的品牌形象:技术卓越、文化不羁、激进开放。
仅开放权重的阶段并未持续太久。到 2024 年初,Mistral 开始提供商业 API 访问,并在更严格的许可下发布模型。其旗舰专有模型 Mistral Large 于 2024 年 2 月推出,直接与 GPT-4 和 Claude 竞争,最初通过 Mistral 自有的 La Plateforme API 和与微软 Azure 的战略合作提供服务。随后推出的 Mistral Medium、Mistral Small 以及专门版本如 Codestral(代码)和 Pixtral(视觉)完善了产品线,旨在每个价格点上展开竞争。Le Chat,Mistral 的消费级聊天机器人,作为公司对 ChatGPT 的回应正式推出。开放与专有模型的双重策略引发了一些开源纯粹主义者的批评,他们认为 Mistral 利用开放发布进行营销后又收回了权限,但这也反映了现实:训练前沿模型的成本高达数亿美元,没有哪家公司仅靠善意就能维持。
Mistral 一直大力强调其欧洲身份,而这不仅仅是为了品牌。该公司已成为欧盟 AI 政策讨论中的关键声音,倡导不会扼杀创新或使欧洲公司在美国和中国竞争对手面前处于劣势的监管框架。当欧盟 AI 法案于 2023 年底最终确定时,Mistral(连同几个欧洲政府,尤其是法国)反对可能对基础模型开发者施加沉重义务的条款,认为这些规则实际上将禁止欧洲公司竞争。最终达成的妥协对 Mistral 的立场更为有利。公司的融资轨迹异常出色——2023 年 12 月的 3.85 亿欧元 A 轮融资(估值约 20 亿美元),随后在 2024 年 6 月的 6 亿欧元融资将公司估值提升至约 60 亿美元,投资者包括 General Catalyst、Andreessen Horowitz 以及战略投资者如三星、Salesforce 和 BNP Paribas。这使 Mistral 成为欧洲历史上最有价值的 AI 初创公司,也是最快达到数十亿美元估值的公司之一。
Mistral 的核心挑战是在没有前沿预算的情况下维持前沿性能。OpenAI、Google 和 Meta 每次训练投入都可达数十亿美元;Mistral 却无法做到。他们的优势在于架构创新和训练效率——每 FLOP 获得更多能力——但随着竞争对手采用类似技术,这一优势正在缩小。公司还必须在开放权重的根源与其商业野心之间找到平衡,这种平衡在模型能力增强且开放发布安全影响更加重要的情况下变得更加困难。来自 DeepSeek 的竞争也增加了压力,DeepSeek 在 2025 年初展示了精明工程团队以极低成本与前沿实验室竞争的可能性。尽管如此,Mistral 结合的技术人才、欧洲支持以及涵盖开放和商业模型的产品线,使其有机会成为 AI 领域中一个持久且独立的力量——这是欧洲在以往技术浪潮中明显缺乏的。