智譜AI縮小了中國學術研究與商業AI之間的差距,推出開放源碼模型—尤其是在視頻生成領域的CogVideoX—已在全球範圍內獲得實際應用。他們的GLM 架構與清華大學的背景賦予他們深厚的技術信譽,使他們成為少數幾個其研究成果在國際上被廣泛引用並作為基礎進行開發的中國AI公司。
智譜 AI 於 2019 年由清華大學知識工程小組脫胎而出,該小組是中國最具聲望的研究機構之一。創始團隊由執行長張鵬領導,並延續教授湯傑的相關研究,曾耗費多年時間建立學術知識圖譜(AMiner)及其他大型知識系統。他們早早就意識到 Transformer 革命將使純語言模型遠遠超越傳統知識圖譜,因此成立公司來商業化這項洞見。這種學術基因使智譜與中國其他 AI 頭部企業區隔開來:雖然百度與阿里巴巴擁有龐大的工程團隊,但智譜從一開始就具備深厚的研發信譽,並直接連結至清華大學的人才庫。
智譜的技術本質圍繞 GLM(General Language Model)架構建構,這與標準的 GPT 風格自回歸方法有所不同。GLM 使用一種自回歸填空目標,將自編碼(如 BERT)與自回歸(如 GPT)預訓練的優勢結合於單一統一框架中。他們的對話模型 ChatGLM 是最早獲得開發者廣泛採用的中文 LLM 之一——部分原因是它早期開放源碼,且能在消費者 GPU 上良好運行。2023 年,ChatGLM-6B 成為一種現象級模型,為開發者提供了一種實際可在單一 GPU 上進行微調的中英雙語模型。2024 年推出的 GLM-4 世代在中文任務上大幅縮小與 GPT-4 的差距,並引入強大的函數呼叫與長上下文能力,使其足以應用於企業場景。
智譜真正區隔其他公司的地方在於多模態生成。他們的圖像生成模型 CogView 是最早達到競爭品質的中文文字到圖像系統之一。CogVideo 及其後繼者 CogVideoX 進一步拓展至 AI 視頻生成,其生成結果在成本僅為 Runway 與 Pika 一小部分的情況下仍可匹敵。至 2025 年,CogVideoX-5B 已成為最強大的開放源碼視頻生成模型之一,廣泛被需要視頻生成能力但不想支付每片段 API 費用的研究人員與開發者使用。這種多模態廣度——文字、圖像、視頻與程式碼生成於一體——賦予智譜一個整合平台敘事,幾乎沒有競爭者能與之匹敵。
智譜吸引了中國科技投資界的眾多重量級人物。2023 年的 3.41 億美元 B 輪融資後,隨後的融資輪次據報導已將公司估值推高至 2024 年中超過 30 億美元。投資方包括社交媒體巨頭美團、半導體公司中关村科學城,以及多個國家支持的基金。這在中國 AI 領域並不罕見——政府的「AI+」策略明確鼓勵國家資本流向基礎模型公司——但智譜的清華大學背景使其在應對北京的優先事項上具有特別優勢。公司被定位為基礎模型領域的國家級冠軍,與百度的 Ernie 及阿里巴巴的 Qwen 競爭,這也帶來了資源與期待。
智譜的商業策略圍繞其 Zhipu Qingyan(BigModel)平台展開,該平台為企業客戶提供 GLM 模型的 API 存取,以及微調工具與代理建構框架。他們在中國企業市場特別積極,目標鎖定金融、教育與政府服務等領域,這些領域因數據主權的擔憂而使外國 AI 提供商無從著手。公司也運營一款面向消費者的聊天機器人,與百度的 Ernie Bot 及阿里巴巴的 Tongyi Qianwen 競爭。對國際 AI 社區而言,智譜最重要的意義在於提供高品質的開放源碼模型——特別是 CogVideoX 已在全球範圍內獲得廣泛關注,遠超中國國界。