微信背后的中国科技巨头,全球最大的游戏公司之一,同时在生成式人工智能领域日益成为一股重要力量。其伏羲模型驱动着腾讯庞大生态系统中的各项功能,服务超过十亿用户。
腾讯由马化腾( Pony Ma )及其四位联合创始人于1998年在深圳创立,最初以名为OICQ的即时通讯服务起家,后更名为QQ。在接下来的二十年里,腾讯经历了科技史上最为瞩目的企业扩张之一。QQ发展成为微信(Weixin),不仅是一款通讯应用,更成为中国日常生活的“操作系统”——为超过13亿月活跃用户处理支付、打车、政府服务、社交媒体、购物等需求。同时,腾讯还构建了全球营收最大的游戏帝国,持有或全资拥有Riot Games(《英雄联盟》)、Supercell(《部落冲突》)、Epic Games(《堡垒之夜》/Unreal Engine)等数十家工作室。到2024年,腾讯已成为全球最有价值的公司之一,市值经常超过4000亿美元,并在中国数字经济的几乎所有领域都有涉足。
腾讯进入基础模型竞赛的起点是“混元”——一个涵盖文本、图像、视频和3D生成的模型家族。其旗舰语言模型“混元-大模型”采用专家混合架构,据报道总参数量超过3000亿。与一些竞争的中国模型相比,腾讯强调实际部署,这些模型从设计之初就旨在集成到腾讯现有产品中,而非仅作为独立研究展示。混元为腾讯云服务、微信的智能回复和翻译功能、企业协作工具及广告优化提供AI功能。公司还开源了多个混元模型,包括混元-7B和图像生成模型,这一举措与国内科技巨头释放开源模型以构建生态影响力的大趋势一致。
腾讯在生成式AI领域最具影响力的突破可能是在视频领域。2024年底发布的文本到视频模型HunyuanVideo,因其能生成高质量且时间一致的视频,迅速引起关注,与Runway、Kling和Pika等专业视频生成公司竞争。该模型的开源发布在该质量级别的视频生成模型中较为罕见——大多数竞争对手仍将其最佳视频模型保留为专有技术。腾讯随后推出改进版和专用变体,利用其在运营中国最大视频流媒体和短视频平台数十年的多媒体技术积累。游戏部门也贡献了AI生成内容工具,使用生成模型以传统艺术流程无法企及的速度创建游戏资产、NPC对话和环境纹理。
尽管在中文市场中规模小于阿里云,腾讯云正积极定位为以AI为核心的云平台。公司投入数十亿美元建设GPU集群和定制化训练基础设施,并提供混元模型作为托管服务,同时支持主流开源模型。腾讯的AI基础设施还包括专用芯片——其自主研发的智骁AI加速器,针对公司内部服务的推理任务进行优化。这种垂直整合(拥有模型、基础设施,并通过拥有数十亿用户的APP进行分发)为腾讯创造了纯AI公司无法复制的飞轮效应:每次模型改进都能立即触达庞大的用户群,生成的反馈数据又进一步提升下一次迭代。
腾讯在AI领域的最大优势,也是其整体公司的核心特征:分发能力。当你拥有13亿微信用户时,将AI功能推送给用户是轻而易举的事。当你拥有中国数字商业、通信和娱乐发生的重要平台时,训练数据充足且反馈循环紧密。但腾讯也面临硅谷实验室所没有的制约。中国对AI的监管广泛,要求对面向公众的生成式AI服务进行审批,并施加内容限制,这决定了模型能生成和不能生成的内容。腾讯庞大的规模也意味着其行动更为谨慎——微信中一个出错的AI功能会影响一亿人,因此部署门槛必然更高。在国际上,腾讯的AI雄心受中美紧张关系和先进芯片出口限制的制约,但公司在海外对游戏工作室和云基础设施的投资,使其具备了众多中国AI公司所缺乏的全球影响力。腾讯真正的疑问不是他们能否构建有竞争力的AI——显然可以——而是他们是否能引领前沿,而非仅仅作为快速跟进者,在集成和部署上表现出色,却在纯粹的研究突破上落后。