Zhipu AI surgio en 2019 del Grupo de Ingenieria del Conocimiento de la Universidad Tsinghua, una de las instituciones de investigacion mas prestigiosas de China. Los fundadores — liderados por el CEO Zhang Peng y basandose en el trabajo del Profesor Tang Jie — habian pasado anos construyendo el Academic Knowledge Graph (AMiner) y otros sistemas de conocimiento a gran escala. Reconocieron tempranamente que la revolucion de los transformers estaba a punto de hacer que los modelos de lenguaje puros fueran mucho mas capaces que los grafos de conocimiento tradicionales, y crearon una empresa para comercializar esa vision. Este ADN academico distingue a Zhipu de los demas campeones de IA de China: mientras Baidu y Alibaba tenian vastos ejercitos de ingenieros, Zhipu comenzo con credibilidad profunda en investigacion y un canal directo al pool de talento de Tsinghua.
La identidad tecnica de Zhipu esta construida alrededor de la arquitectura GLM (General Language Model), que difiere del enfoque autoregresivo estandar estilo GPT. GLM usa un objetivo autoregresivo de llenado de espacios en blanco que combina las fortalezas del pre-entrenamiento por autocodificacion (como BERT) y autoregresivo (como GPT) en un solo marco unificado. ChatGLM, su modelo conversacional, fue uno de los primeros LLMs chinos en ganar amplia adopcion entre desarrolladores — en parte porque fue liberado como open source tempranamente y corria bien en GPUs de consumo. ChatGLM-6B se convirtio en algo de fenomeno en 2023, ofreciendo a los desarrolladores un modelo bilingue chino-ingles que realmente podian afinar en una sola GPU. La generacion GLM-4, lanzada en 2024, cerro gran parte de la brecha con GPT-4 en tareas de idioma chino e introdujo solidas capacidades de function calling y contexto largo que lo hicieron viable para aplicaciones empresariales.
Donde Zhipu realmente se diferencia es en generacion multimodal. CogView, su modelo de generacion de imagenes, fue uno de los primeros sistemas chinos de texto a imagen en alcanzar calidad competitiva. CogVideo y su sucesor CogVideoX incursionaron en la generacion de video con IA, produciendo resultados que resistian la comparacion con Runway y Pika a una fraccion del costo. Para 2025, CogVideoX-5B se habia convertido en uno de los modelos de generacion de video open source mas capaces disponibles, ampliamente utilizado por investigadores y desarrolladores que necesitaban capacidades de generacion de video sin pagar cuotas por clip via API. Esta amplitud multimodal — generacion de texto, imagen, video y codigo bajo un mismo techo — le da a Zhipu una historia de plataforma integrada que pocos competidores pueden igualar.
Zhipu ha atraido a los principales inversionistas tecnologicos de China. Una Serie B de $341 millones en 2023 fue seguida por rondas adicionales que supuestamente valoraron a la empresa en mas de $3 mil millones para mediados de 2024. Los inversionistas incluyen al gigante de redes sociales Meituan, la firma de semiconductores Zhongguancun Science City y multiples fondos respaldados por el estado. Esto no es inusual en el panorama de IA chino — la estrategia "IA+" del gobierno alienta explicitamente al capital estatal a fluir hacia empresas de modelos fundacionales — pero el pedigri de Tsinghua de Zhipu le da una ventaja particular para navegar las prioridades de Beijing. La empresa ha sido posicionada como un campeon nacional en el espacio de modelos fundacionales, junto con Ernie de Baidu y Qwen de Alibaba, lo cual trae tanto recursos como expectativas.
La estrategia comercial de Zhipu se centra en su plataforma Zhipu Qingyan (BigModel), que ofrece acceso API a modelos GLM para clientes empresariales, junto con herramientas de fine-tuning y un framework para construir agentes. Han sido particularmente agresivos en el mercado empresarial chino, apuntando a sectores como finanzas, educacion y servicios gubernamentales donde las preocupaciones de soberania de datos hacen que los proveedores de IA extranjeros no sean una opcion. La empresa tambien opera un chatbot de cara al consumidor que compite con Ernie Bot de Baidu y Tongyi Qianwen de Alibaba. Para la comunidad internacional de IA, Zhipu importa mas como fuente de modelos open source de alta calidad — CogVideoX en particular ha encontrado una audiencia global que se extiende mucho mas alla de las fronteras de China.