MiniMax a été fondée en décembre 2021 par Yan Junjie, ancien responsable de l'IA chez Megvii (l'entreprise chinoise de vision par ordinateur derrière Face++), accompagné d'une équipe de chercheurs issus des plus grandes entreprises technologiques chinoises. Le moment était notable — lancer une entreprise d'IA entre la sortie de GPT-3 et ChatGPT signifiait parier sur les modèles fondationnels avant que le cycle d'engouement n'explose véritablement. Yan avait une thèse claire : construire des modèles fondationnels multimodaux de zéro et les envelopper dans des produits grand public capables d'atteindre une échelle massive sur le marché chinois. Contrairement à de nombreuses startups chinoises d'IA qui se concentraient d'abord sur les ventes aux entreprises, MiniMax a visé les consommateurs dès le premier jour avec une ambition qui a suscité des comparaisons avec un jeune ByteDance.
Le produit le plus visible de MiniMax est Hailuo AI (littéralement « escargot de mer »), une plateforme grand public lancée comme application compagnon de clavardage et qui a évolué vers quelque chose de bien plus intéressant. Les capacités de génération vidéo de Hailuo, lancées fin 2024, ont stupéfié la communauté de l'IA par leur qualité et leur cohérence. Le générateur vidéo Hailuo AI est rapidement devenu l'un des outils de génération vidéo gratuits les plus populaires au monde, produisant des clips rivalisant en qualité avec Runway Gen-3 et Kling tout en étant librement accessible. C'était une stratégie délibérée : utiliser un produit grand public gratuit pour démontrer les capacités du modèle, attirer des utilisateurs, collecter des données et construire une notoriété de marque à l'international. Début 2025, Hailuo était devenu synonyme de génération vidéo par IA accessible et de haute qualité, et MiniMax recevait des marques d'intérêt de studios hollywoodiens et d'agences de publicité cherchant des alternatives rentables aux effets spéciaux traditionnels.
Ce qui rend MiniMax techniquement intéressant, c'est l'ampleur de leur développement de modèles en interne. La plupart des startups d'IA se spécialisent — texte ou image ou voix. MiniMax développe sur les trois modalités plus la vidéo. Leurs modèles de langage (la série abab) ont été discrètement compétitifs avec leurs pairs chinois, bien que moins connus internationalement que Qwen ou GLM. Leur technologie de synthèse vocale alimente le clonage vocal réaliste et la conversion texte-vers-parole qui rivalisent en qualité avec ElevenLabs. Et leur modèle de génération vidéo utilise une architecture propriétaire qui gère à la fois le texte-vers-vidéo et l'image-vers-vidéo avec une forte cohérence temporelle et une bonne qualité de mouvement. L'entreprise a également publié MiniMax-01, un grand modèle de langage doté d'un mécanisme d'attention « éclair » conçu pour des contextes extrêmement longs, signalant de sérieuses ambitions dans le domaine des grands modèles de langage au-delà de la seule génération de médias.
MiniMax a été l'une des startups d'IA les mieux financées en Chine. Une ronde de 600 millions de dollars mi-2024 aurait valorisé l'entreprise à 2,5 milliards de dollars, avec le soutien d'Alibaba, Tencent et de plusieurs fonds souverains. Ce double soutien des deux plus grands conglomérats technologiques chinois est inhabituel — Alibaba et Tencent co-investissent rarement — et signale l'importance stratégique perçue de la technologie multimodale de MiniMax. L'entreprise a dépensé agressivement en puissance de calcul GPU, exploitant selon les rapports des milliers de A100 acquises avant que les restrictions américaines à l'exportation ne se resserrent complètement, et en complétant avec des alternatives nationales. Comme tous les laboratoires d'IA chinois, MiniMax fait face à la pénurie de puces comme contrainte fondamentale, mais leur orientation vers des architectures efficaces et un déploiement à l'échelle grand public plutôt que vers la taille brute de modèles de pointe les rend moins dépendants du matériel le plus récent.
MiniMax occupe une position singulière dans le paysage chinois de l'IA : trop axé sur le grand public pour être classé avec les entreprises orientées entreprise comme Zhipu et Baichuan, trop ambitieux techniquement pour être réduit à une simple entreprise d'applications. Leur véritable concurrence est de plus en plus mondiale — Runway, Luma et Kling en vidéo ; ElevenLabs en voix ; et les principaux fournisseurs de grands modèles de langage en texte. L'expansion internationale via Hailuo AI leur offre un canal de distribution que la plupart des entreprises d'IA chinoises n'ont pas, puisque la distribution via WeChat et Douyin ne fonctionne pas en dehors de la Chine. Que MiniMax puisse soutenir son approche multi-fronts ou doive se recentrer reste une question ouverte, mais leur capacité à livrer des produits de haute qualité en texte, voix et vidéo avec une équipe relativement petite en a fait l'une des entreprises les plus intéressantes à suivre dans l'IA mondiale.