字節跳動是全球最有價值的私營科技公司,以規模部署AI技術,少有組織能與之比擬,透過TikTok、抖音以及不斷擴展的AI驅動產品組合,每日服務超過十億用戶。他們的Doubao模型家族與火山引擎雲平台,使他們在基礎模型競賽中成為一股不可小觑的力量,背後擁有大多數AI新創公司只能夢寐以求的資源:龐大且盈利的核心業務,以及內建的十億用戶分發渠道。
字節跳動於2012年由張一鳴創立,張一鳴是一位軟體工程師,他近乎宗教般堅信,應該由演算法而非人類編輯來決定人們看到的內容。他第一個成功產品「今日頭條」(Jinri Toutiao)是一款新聞聚合器,早在「演算法」在西方成為文化概念之前,就已使用機器學習來個性化推薦內容。2017年國際推出的TikTok,將相同的推薦引擎套用於短視頻,創造出歷史上可能是最成功的AI消費者產品。當2022年生成式AI浪潮來臨時,字節跳動在任何衡量標準下早已是全球最大的AI公司之一——只是人們因為將其視為社交媒體公司,而未將其歸類為AI公司。
字節跳動的人工智慧研究部門多年來以龐大的規模靜默運作。公司在北京、上海、新加坡和山景城的實驗室聘有數千名機器學習研究員和工程師。當ChatGPT迫使每家科技公司展現實力時,字節跳動迅速行動。他們的大型語言模型與對話式AI平台「豆包」(Doubao,字面意思是「豆袋」)於2023年8月在中國推出,迅速成為該國使用最廣的聊天機器人之一。到2024年,豆包每月活躍用戶已超過1億——這個數字反映了字節跳動透過抖音(Douyin,中國版TikTok)、飛書(Feishu,其企業協作工具在中國外稱為Lark)及其他產品生態系統分發AI產品的無與倫比的能力。豆包模型系列本身與通義千問(Qwen)和文心一言(Ernie)競爭,但字節跳動對開放源碼較為保守,更傾向將模型作為自身產品的競爭優勢。
字節跳動的雲端部門「火山引擎」(Volcano Engine,中文名為「火山引擎」,原名為「火山引擎」)是其實現AI即服務(AI-as-a-service)雄心的載體。火山引擎於2021年推出,最初是為了將字節跳動為服務TikTok全球流量所建的基礎設施商品化。隨著生成式AI的興起,火山引擎重新定位為模型平台,提供豆包API以及微調、部署和評估工具。定價策略極具侵略性——字節跳動與阿里雲和百度展開價格戰,大幅削減API費用以爭取開發者市場份額。這正是典型的字節跳動策略:用廣告業務的現金補貼成長,壓低競爭對手,並在分發上取得優勢。儘管在中國雲端市場中,火山引擎仍遠遠落後於阿里雲和華為雲,但AI的切入點為其提供了差異化的優勢。
任何關於字節跳動AI策略的討論都必須面對房間裡的 geopolitical 大象。美國持續上演的可能封禁TikTok的戲碼,迫使字節跳動維持一種不尋常的組織結構,使TikTok的美國運營與北京相對隔離。美國對晶片的出口管制以及更廣泛的技術脫鉤,又增加了另一層複雜性。據報導,字節跳動已大量囤積NVIDIA GPU,並投資於本土晶片替代方案,但中美科技關係的不確定性仍懸浮在每項戰略決策之上。諷刺的是,字節跳動的核心AI能力——推薦系統——正是美國國會議員認為最具威脅的技術,因為它每天決定十億用戶能看到什麼。
與其他中國AI實驗室相比,字節跳動的獨特之處在於其部署規模的龐大。雖然智譜、MiniMax和百川等公司正在打造令人印象深刻的模型,但字節跳動已將AI應用於其產品組合中超過十億的每日活躍用戶。抖音上的每一個視頻推薦、TikTok上的每一次翻譯、飛書中的每一次智能回覆——這些都是以遠超大多數專注於AI公司的規模進行的AI推理調用。這為字節跳動帶來了兩大極難複製的優勢:一個龐大且不斷更新的人類偏好與行為數據集,以及在行星規模上部署模型的經過驗證的基礎設施。當字節跳動進入新的AI產品類別時,它無需重新思考分發問題——它已經擁有分發能力。問題在於,一家優化於注意力驅動的短視頻的公司,是否也能打造出企業客戶和創意專業人士所要求的深度、值得信賴的AI工具。