Zubnet AIApprendreWiki › Zhipu AI
Compagnies

Zhipu AI

Aussi appelé : GLM, ChatGLM, CogView, CogVideo
Entreprise d'IA chinoise issue de l'Université Tsinghua. Derrière la famille de modèles GLM et l'une des principales plateformes d'IA en Chine, avec des forces en génération textuelle et visuelle.

Pourquoi c’est important

Zhipu AI fait le pont entre la recherche académique et l'IA commerciale en Chine, produisant des modèles libres — en particulier en génération vidéo avec CogVideoX — qui ont connu une adoption véritablement mondiale. Leur architecture GLM et leurs racines à Tsinghua leur confèrent une crédibilité technique profonde, faisant de Zhipu l'une des rares entreprises d'IA chinoises dont les contributions à la recherche sont largement citées et utilisées comme fondement à l'échelle internationale.

En profondeur

Zhipu AI a émergé en 2019 du Knowledge Engineering Group de l'Université Tsinghua, l'une des institutions de recherche les plus prestigieuses de Chine. Les fondateurs — dirigés par le PDG Zhang Peng et s'appuyant sur les travaux du professeur Tang Jie — avaient passé des années à construire le graphe de connaissances académiques AMiner et d'autres systèmes de connaissances à grande échelle. Ils ont reconnu tôt que la révolution du transformer allait rendre les modèles de langage purs bien plus capables que les graphes de connaissances traditionnels, et ont créé une entreprise pour commercialiser cette intuition. Cet ADN académique distingue Zhipu des autres champions chinois de l'IA : là où Baidu et Alibaba disposaient de vastes armées d'ingénieurs, Zhipu a démarré avec une crédibilité de recherche profonde et un pipeline direct vers le bassin de talents de Tsinghua.

L'architecture GLM

L'identité technique de Zhipu est construite autour de l'architecture GLM (General Language Model), qui diffère de l'approche autorégressivee standard de type GPT. GLM utilise un objectif autorégressif de remplissage de blancs qui combine les forces du pré-entraînement auto-encodeur (comme BERT) et autorégressif (comme GPT) dans un cadre unifié unique. ChatGLM, leur modèle conversationnel, a été l'un des premiers grands modèles de langage chinois à connaître une large adoption parmi les développeurs — en partie parce qu'il a été rendu libre tôt et fonctionnait bien sur des GPU grand public. ChatGLM-6B est devenu un véritable phénomène en 2023, offrant aux développeurs un modèle bilingue chinois-anglais qu'ils pouvaient réellement affiner sur un seul GPU. La génération GLM-4, publiée en 2024, a comblé une grande partie de l'écart avec GPT-4 sur les tâches en langue chinoise et a introduit de solides capacités d'appel de fonctions et de contexte long, le rendant viable pour les applications en entreprise.

Au-delà du texte : CogView et CogVideo

Là où Zhipu se distingue vraiment, c'est dans la génération multimodale. CogView, leur modèle de génération d'images, a été l'un des premiers systèmes chinois de texte-vers-image à atteindre une qualité compétitive. CogVideo et son successeur CogVideoX se sont lancés dans la génération vidéo par IA, produisant des résultats qui tenaient la comparaison avec Runway et Pika pour une fraction du coût. D'ici 2025, CogVideoX-5B était devenu l'un des modèles de génération vidéo libres les plus performants disponibles, largement utilisé par les chercheurs et développeurs ayant besoin de capacités de génération vidéo sans payer de frais d'API par clip. Cette ampleur multimodale — génération de texte, d'images, de vidéo et de code sous un même toit — confère à Zhipu une histoire de plateforme intégrée que peu de concurrents peuvent égaler.

Financement et soutien gouvernemental

Zhipu a attiré le gratin de l'investissement technologique chinois. Une Série B de 341 millions de dollars en 2023 a été suivie de rondes supplémentaires qui auraient valorisé l'entreprise à plus de 3 milliards de dollars mi-2024. Parmi les investisseurs figurent le géant des médias sociaux Meituan, le fabricant de semi-conducteurs Zhongguancun Science City et de multiples fonds soutenus par l'État. Ce n'est pas inhabituel dans le paysage de l'IA chinoise — la stratégie gouvernementale « IA+ » encourage explicitement le capital public à affluer vers les entreprises de modèles fondationnels — mais le pedigree de Tsinghua confère à Zhipu un avantage particulier pour naviguer les priorités de Pékin. L'entreprise a été positionnée comme champion national dans le domaine des modèles fondationnels, aux côtés d'Ernie de Baidu et de Qwen d'Alibaba, ce qui apporte à la fois des ressources et des attentes.

La stratégie de plateforme

La stratégie commerciale de Zhipu est centrée sur leur plateforme Zhipu Qingyan (BigModel), qui offre un accès API aux modèles GLM pour les clients entreprises, accompagné d'outils d'affinage et d'un cadriciel de construction d'agents. Ils ont été particulièrement agressifs sur le marché chinois des entreprises, ciblant des secteurs comme la finance, l'éducation et les services gouvernementaux où les préoccupations de souveraineté des données rendent les fournisseurs d'IA étrangers inenvisageables. L'entreprise exploite également un agent conversationnel grand public en concurrence avec Ernie Bot de Baidu et Tongyi Qianwen d'Alibaba. Pour la communauté internationale de l'IA, Zhipu compte surtout comme source de modèles libres de haute qualité — CogVideoX en particulier a trouvé un public mondial qui s'étend bien au-delà des frontières chinoises.

Concepts connexes

← Tous les termes
← Zero-shot / Few-shot
ESC