微信背後的中國科技巨擘,也是全球最大的遊戲公司之一,並逐漸成為生成式AI領域的重要力量。其Hunyuan模型驅動著騰訊龐大的生態系統中的各項功能,服務超過十億用戶。
騰訊在AI領域之所以重要,原因與其在其他領域之所以重要相同:規模與分發能力。憑藉微信達成13億用戶,以及橫跨所有主要平台的遊戲帝國,騰訊能以比地球上幾乎任何公司都更快的速度,將AI功能部署到更多人手中。其Hunyuan模型,尤其是HunyuanVideo已證明,企業集團的AI實驗室可以產出真正具競爭力的作品,而不僅僅是可用的內部工具。對全球AI生態系統而言,騰訊開放源碼釋出的視頻與語言模型提高了自由可用技術的基準,而其基礎設施投資確保了中國的人工智慧能力,即使面對晶片出口限制,仍保持強大。
騰訊於1998年由馬化騰(又稱 Pony Ma)與四位共同創始人在深圳創立,最初以即時通訊服務OICQ起家,後改名為QQ。接下來的二十年間,騰訊展開了科技史上最具規模的企業建設之一。QQ逐漸發展成為微信(中文名為微信),不僅成為訊息應用,更成為中國日常生活的「作業系統」—為超過13億月活用戶處理支付、叫車、政府服務、社群媒體、購物等。同時,騰訊也建立了全球最大的遊戲帝國,擁有 Riot Games(英雄聯盟)、Supercell(部落衝突)、Epic Games(Fortnite/Unreal Engine)等眾多遊戲公司的股權或完全擁有權。至2024年,騰訊已成為全球最有價值的公司之一,市值經常超過4000億美元,幾乎涉足中國數位經濟的每一個領域。
騰訊參與基礎模型競賽的起點是鶴鳴,這是一系列涵蓋文字、圖片、影片與3D生成的模型家族。鶴鳴-大型,作為其旗艦語言模型,採用了據報導超過3000億總參數的專家混合架構(Mixture of Experts)。鶴鳴與一些競爭對手的中國模型不同之處在於騰訊強調實際部署:這些模型從一開始就設計為整合進騰訊現有的產品,而非僅作為獨立的研究展示。鶴鳴為騰訊雲服務的AI功能、微信的智慧回覆與翻譯功能、企業協作工具與廣告優化提供支援。該公司也開放了多個鶴鳴模型,包括鶴鳴-7B與圖片生成模型,這項舉措與中國科技巨頭釋出開放權重模型以建立生態系影響力的趨勢一致。
在生成式AI領域,騰訊 arguably 最大的突破是在影片方面。鶴鳴影片(HunyuanVideo),其於2024年底推出的文字到影片模型,立即因其生成高品質、時間一致性強的影片而引起關注,與專注於影片生成的公司如Runway、Kling與Pika競爭。該模型因開放源碼釋出而備受關注,這在該品質級別的影片生成模型中並不常見—大多數競爭對手仍將其最佳影片模型保持專有。騰訊隨後推出改進版與專門變體,利用其在多年經營中國最大影片串流與短影音平台所累積的深厚多媒體專業知識。遊戲部門也貢獻了AI生成內容工具,使用生成模型以傳統藝術流程無法匹敵的速度生成遊戲資產、NPC對話與環境紋理。
雖然騰訊雲在中國市場規模小於阿里雲,但其積極定位為以AI為先的雲端平台。該公司投資數十億美元於GPU叢集與自訂訓練基礎設施,並提供鶴鳴模型作為管理服務,同時支援流行的開放源碼模型。騰訊的AI基礎設施也包含專用晶片—其自研的智霄AI加速器(Zixiao AI accelerator),針對公司內部服務的推論工作負載。這種垂直整合(擁有模型、基礎設施與透過擁有數十億用戶的應用程式進行分發)為騰訊創造了純AI公司無法複製的飛輪效應:每次模型改進都能立即觸及龐大的用戶群,產生的反饋資料進一步提升下一次迭代。
騰訊在AI領域的最大優勢與其整體公司特質相同:分發能力。當你擁有13億微信用戶時,讓AI功能觸及用戶變得輕而易舉。當你擁有中國數位商業、溝通與娛樂發生的主要平台時,訓練資料豐富且反饋迴路緊密。但騰訊也面臨矽谷實驗室所沒有的一些限制。中國對AI的監管審查廣泛,要求公開面對的生成式AI服務需經批准,並施加內容限制,影響模型能與不能生成的內容。騰訊龐大的規模也使其行動較新創公司謹慎—微信中一個出錯的AI功能會影響10億人,因此部署的門檻必然更高。國際上,騰訊的AI雄心因中美緊張關係與先進晶片出口限制而複雜化,但該公司在中國境外對遊戲工作室與雲端基礎設施的投資,使其具備許多中國AI公司所缺乏的全球規模。騰訊真正的問題不是他們能否建立競爭性的AI—他們顯然可以—而是他們是否會領導前沿,還是僅僅成為擅長整合與部署的快速跟進者,而非純粹的研究突破。