阿里巴巴雲已將通義千問打造成亞洲部署最廣的開放權重模型家族,並成為與Meta的Llama真正競爭的全球級模型,證明具備前沿能力的模型可以來自矽谷以外。他們結合開放模型釋出、龐大的雲端基礎設施與ModelScope生態系統,為開發者—尤其是受美國出口管制影響的市場—提供一個可信賴且高品質的西方AI平台替代方案。
阿里巴巴雲(又稱為阿里雲)於2009年作為馬雲創辦的阿里巴巴集團旗下的雲計算部門成立,最初是為了處理雙十一(全球最大的線上購物活動)期間瘋狂的流量高峰。從最初的內部基礎設施,逐漸成為中國市場佔有率最高的公共雲服務供應商,佔據約三分之一的國內市場。但對AI世界來說,真正的轉折點始於2023年,當時阿里巴巴雲推出了第一個Qwen(通義千問)模型,並承諾採用積極的開放權重策略,重新塑造全球可存取基礎模型的格局。
Qwen系列的發展速度之快,甚至讓西方實驗室都感到驚訝。Qwen 1.0於2023年中旬推出,是一款表現尚可但並不出眾的大型語言模型。Qwen 1.5於2024年初推出,大幅縮小了與前沿模型之間的差距。隨後Qwen 2和Qwen 2.5迅速接續推出,其中Qwen2.5-72B在大多數基準測試中表現與Llama 3.1-70B不相上下,而且真正具備多語言能力——不僅僅是英語加一點中文,還在阿拉伯語、日語、韓語以及東南亞語言等數十種語言上表現強勁,而這些語言大多數西方模型處理得並不理想。由阿里巴巴達摩院的白金贊帶領的Qwen團隊,還擴展到了多模態領域,包括用於視覺語言任務的Qwen-VL、Qwen-Audio,以及專門的程式設計變體(Qwen-Coder)和數學模型(Qwen-Math)。到2025年,Qwen已成為亞洲許多地區生產環境中事實上的預設開放權重模型家族。
阿里巴巴雲決定在Apache 2.0授權協議下釋出Qwen模型,並非出於 altruism(利他主義),而是經過計算的策略,旨在擴大雲端市場份額。這套策略與Meta的Llama策略如出一轍:贈送模型,銷售計算資源。每一個在阿里巴巴雲ModelScope平台微調Qwen的開發者、每一家透過阿里巴巴推論API部署Qwen的初創公司、每一家基於Qwen並需要托管服務的企業——他們都可能成為雲端服務的潛在客戶。這種策略在美國對先進晶片的出口管制使得運行美國供應商的前沿封閉模型變得不切實際或政治上不願見的市場中,效果尤其顯著。阿里巴巴雲已將Qwen定位為那些希望建立本土AI能力但不依賴OpenAI或Google的國家的主權AI選擇。
自2022年10月以來反覆加嚴的美國對中國先進半導體的出口管制,是每一家中國AI實驗室——包括阿里巴巴雲——所面臨的關鍵限制。無法購買NVIDIA H100或其後繼產品,阿里巴巴已大力投資自家的漢光800 AI加速器,並據報導在禁令生效前已囤積了較舊的A100晶片。Qwen團隊也變得特別高效,似乎在訓練計算資源上遠低於同類西方模型,卻仍能取得強勁的成果。無論這是否是真正的演算法效率,還是僅僅是較不透明的報告,結果都說明了一切:Qwen模型始終表現超出其規模。
在中國AI實驗室中,阿里巴巴雲的定位獨特,因為它結合了龐大的雲端基礎設施與前沿模型開發。百度擁有Ernie模型,但雲端業務較弱。騰訊擁有雲端規模,但模型表現較不突出。阿里巴巴則兩者兼備,再加上ModelScope平台(中國版的Hugging Face),該平台已成為中國生態系統中開放源碼AI的中心樞紐。2023年11月將雲端部門分拆並取消首次公開募股的決定,反映了內部在積極投資AI與優化利潤之間的矛盾。到2025年初,阿里巴巴集團已承諾未來三年在雲端和AI基礎設施上投資逾500億美元——這是一個明確的信號,表明AI優先策略獲得了勝利。對於美國科技生態系統之外的開發者和企業來說,阿里巴巴雲和Qwen已成為對抗OpenAI-微軟軸心的最可信開放替代方案。