字节跳动是全球最有价值的私营科技公司,其AI部署规模鲜有对手,通过TikTok、Douyin以及不断扩展的AI驱动产品,每天服务超过十亿用户。他们的Doubao模型家族和火山引擎云平台使其成为基础模型竞赛中的强劲竞争者,背后拥有大多数AI初创公司只能梦寐以求的资源:一个大规模且盈利的核心业务,以及面向十亿用户的内置分发渠道。
字节跳动由软件工程师张一鸣于2012年创立,他几乎以宗教般的信念坚信,算法而非人类编辑应决定用户看到的内容。他的首个爆款产品今日头条是一款新闻聚合器,早在“算法”成为西方文化概念之前,就使用机器学习技术实现了个性化推荐。2017年面向国际市场推出的抖音(TikTok)将同样的推荐引擎应用于短视频,创造了历史上最成功的AI驱动消费产品之一。到2022年生成式AI浪潮来袭时,字节跳动在任何衡量标准下已经是全球最大的AI公司之一——只是人们一直将其视为社交媒体公司,而未将其归类为AI公司。
字节跳动的AI研究部门多年来一直低调但大规模地运作。公司在北京、上海、新加坡和山景城的实验室中雇佣了数千名机器学习研究员和工程师。当ChatGPT迫使每家科技公司展示实力时,字节跳动迅速行动。豆包(意为“豆袋”),他们的大型语言模型和对话式AI平台,于2023年8月在中国推出,并迅速成为国内使用最广泛的聊天机器人之一。到2024年,豆包的月活跃用户已超过1亿——这一数字反映了字节跳动通过抖音(中国版TikTok)、飞书(其企业协作工具,在中国以外称为Lark)及其他产品生态,无与伦比的AI产品分发能力。豆包模型本身与通义千问和文心一言具有竞争力,但字节跳动在开源方面较为保守,更倾向于将模型作为自身产品的竞争优势。
字节跳动的云业务部门火山引擎(火山引擎,原名“火山云”)是其实现人工智能即服务(AI-as-a-service)雄心的载体。火山引擎于2021年推出,最初是为了变现为TikTok全球流量服务所构建的基础设施。随着生成式AI热潮的兴起,火山引擎重新定位为模型平台,提供豆包API接口以及微调、部署和评估工具。定价策略非常激进——字节跳动与阿里云和百度展开了价格战,大幅削减API成本以争夺开发者市场份额。这是典型的字节跳动策略:用广告业务带来的现金流补贴增长,压低竞争对手,依靠分发渠道取胜。尽管火山引擎在中国云市场中仍落后于阿里云和华为云,但AI角度为其提供了差异化的切入点。
任何关于字节跳动AI战略的讨论都必须正视房间里的“大象”——美国可能禁止抖音的持续风波。这迫使字节跳动维持了一种不寻常的组织结构,使得抖音在美国的运营在某种程度上与北京隔离。美国对芯片的出口管制以及更广泛的技术脱钩增加了另一层复杂性。据报道,字节跳动已囤积了大量NVIDIA GPU,并投资于国产芯片替代方案,但中美科技关系的不确定性笼罩着每一个战略决策。讽刺的是,字节跳动的核心AI能力——推荐系统——正是美国立法者认为最具威胁的技术,因为它决定了十亿多用户每天看到的内容。
与所有其他中国AI实验室不同,字节跳动的独特之处在于其部署的规模。尽管智谱、MiniMax和百川等公司正在构建令人印象深刻的模型,但字节跳动已将其AI应用到产品组合中超过十亿的每日活跃用户。抖音上的每一条视频推荐、TikTok上的每一次翻译、飞书中的每一次智能回复——这些AI推理调用的规模远远超过了大多数专门AI公司的全部运营。这为字节跳动带来了两个难以复制的优势:一个庞大的、不断更新的人类偏好和行为数据集,以及在行星级规模上服务模型的经过实战检验的基础设施。当字节跳动进入新的AI产品类别时,它无需考虑分发渠道——它已经拥有。问题是,一家优化于注意力驱动短视频的公司,是否也能构建企业客户和创意专业人士所要求的那种深度、可信赖的AI工具。