Zubnet AI学习Wiki › 智谱 AI
公司

智谱 AI

别名:GLM、ChatGLM、CogView、CogVideo
由清华大学孵化的中国人工智能公司。GLM模型家族的开发者之一,也是中国领先的AI平台之一,在语言和视觉生成领域具有优势。

为什么重要

智谱AI弥合了中国学术研究与商业人工智能之间的差距,开发了获得全球实际应用的开源模型—尤其是在视频生成领域推出的CogVideoX模型—。其GLM架构和清华大学的背景赋予了其深厚的技术可信度,使他们成为少数几家在全球范围内被广泛引用和借鉴其研究成果的中国人工智能公司。

深度解析

智谱AI成立于2019年,源自中国顶尖研究机构清华大学的知识工程组。创始人——由CEO张鹏领导,并借鉴了唐杰教授的研究成果——多年来一直致力于构建学术知识图谱(AMiner)等大规模知识系统。他们很早就意识到,Transformer革命将使纯语言模型远超传统知识图谱的能力,因此分拆出一家公司来商业化这一洞察。这种学术基因使智谱区别于中国其他AI巨头:虽然百度和阿里巴巴拥有庞大的工程团队,但智谱从一开始就具备深厚的研究可信度,并且可以直接接入清华大学的人才池。

GLM架构

智谱的技术身份围绕GLM(General Language Model)架构构建,这与标准的GPT风格自回归方法不同。GLM采用一种自回归的空白填充目标,将自编码(如BERT)和自回归(如GPT)预训练的优势结合在一个统一框架中。他们的对话模型ChatGLM是最早获得开发者广泛采用的中文LLM之一——部分原因在于它早期开源,并且在消费级GPU上运行良好。2023年,ChatGLM-6B成为现象级产品,为开发者提供了一个可以在单块GPU上微调的中英文双语模型。2024年发布的GLM-4一代在中文任务上大幅缩小了与GPT-4的差距,并引入了强大的函数调用和长上下文能力,使其适用于企业应用。

超越文本:CogView和CogVideo

智谱真正区别于其他公司的地方在于多模态生成。他们的图像生成模型CogView是最早实现竞争力的中文文本到图像系统之一。CogVideo及其继任者CogVideoX进入AI视频生成领域,以远低于Runway和Pika的成本生成高质量结果。到2025年,CogVideoX-5B已成为最强大的开源视频生成模型之一,被需要视频生成能力但不想支付每片段API费用的研究人员和开发者广泛使用。这种多模态广度——文本、图像、视频和代码生成一体化——赋予了智谱一个竞争对手难以匹敌的集成平台故事。

融资与政府支持

智谱吸引了中国科技投资界的一众重量级人物。2023年3.41亿美元的B轮融资后,后续几轮融资使其估值在2024年中期超过30亿美元。投资者包括社交媒体巨头美团、半导体公司中关村科学城以及多家国有背景基金。这在中国AI领域并不罕见——政府的“AI+”战略明确鼓励国有资本流向基础模型公司——但智谱的清华背景使其在应对北京优先事项时具有独特优势。该公司被定位为基础模型领域的国家级冠军,与百度的Ernie和阿里巴巴的Qwen并列,这既带来了资源,也带来了期待。

平台战略

智谱的商业战略围绕其Zhipu Qingyan(BigModel)平台展开,该平台为企业客户提供GLM模型的API访问,以及微调工具和代理构建框架。他们在中文企业市场尤为激进,针对金融、教育和政府服务等数据主权问题使外国AI提供商无法进入的领域。公司还运营一款面向消费者的聊天机器人,与百度的Ernie Bot和阿里巴巴的Tongyi Qianwen竞争。对于国际AI社区而言,智谱最重要的意义在于提供高质量的开源模型——特别是CogVideoX,其全球受众已远超中国国界。

相关概念

← 所有术语
← Zero-shot / Few-shot
ESC