Meta AI 的故事始於 2013 年 12 月,當時 Mark Zuckerberg 延攬了 Yann LeCun —— 與 Geoffrey Hinton、Yoshua Bengio 並稱「深度學習三巨頭」之一 —— 來領導 Facebook AI Research(FAIR)。LeCun 是紐約大學教授、卷積神經網路的先驅,他帶來了即時的學術公信力和明確的研究哲學:進行基礎研究、公開發表、不施加短期產品壓力。FAIR 迅速成為全球最多產且最受尊敬的 AI 實驗室之一,吸引頂尖人才,並在電腦視覺、自然語言處理和自監督學習等領域產出具有影響力的成果。對於企業研究部門而言,該實驗室擁有非比尋常的學術自由,而 LeCun 的存在為其帶來了少數業界實驗室能匹敵的影響力。
即便 Meta AI 什麼都沒做,光憑 PyTorch 就足以奠定其歷史地位。PyTorch 於 2016 年作為 Torch 框架的進化版發布,迅速成為研究界乃至生產環境中佔主導地位的深度學習框架。其「定義即執行」的動態計算圖比 TensorFlow 最初的靜態圖方式更直覺,開發者體驗也明顯更好。到了 2020 年代初期,絕大多數 AI 研究論文都使用 PyTorch,而你今天接觸到的大多數模型 —— 包括來自 OpenAI、Anthropic 和 Mistral 的模型 —— 都是在其上訓練的。Meta 將 PyTorch 開源,並於 2022 年將其捐贈給 Linux 基金會,使其真正成為社群治理的專案。這並非純粹的利他行為;透過讓 PyTorch 成為標準,Meta 確保了整個 AI 生態系統都建立在它深諳的基礎設施之上。
2023 年 2 月,Meta 發布了 LLaMA(Large Language Model Meta AI),一系列從 7B 到 65B 參數的模型,最初僅限研究人員使用。不到一週,權重就外洩到網路上。Meta 非但沒有對抗,反而順勢而為:Llama 2(2023 年 7 月)以寬鬆授權條款釋出,可同時用於研究和商業用途,而 Llama 3(2024 年 4 月)和 Llama 4(2025 年)則延續了開放權重策略,推出競爭力越來越強的模型。這一決策重塑了整個產業。在 Llama 之前,主流假設是前沿模型將持續保持專有封閉。在 Llama 之後,大量的微調版本、量化版本和衍生模型湧現,開放權重運動成為一股不可忽視的競爭力量。Meta 的動機部分出於策略考量 —— 如果 AI 模型被商品化,價值就會轉移到部署這些模型的平台上,而 Meta 在 Facebook、Instagram、WhatsApp 和 Threads 上擁有超過 30 億用戶 —— 但無論動機為何,其對 AI 普及化的實際影響是真實的。
Mark Zuckerberg 在 AI 上的個人投入既龐大又高調。在元宇宙轉型未能抓住公眾想像力(且耗資數百億美元)之後,Zuckerberg 在 2023 至 2024 年間將 Meta 重新定位為「AI 優先」公司。資本支出驚人:Meta 建造了全球最大的 GPU 叢集之一(最初超過 60 萬顆 H100 GPU,且計劃持續擴增),到 2025 年每年在 AI 基礎設施上的支出超過 300 億美元。Meta AI 這個由 Llama 驅動的消費者端助理被整合到 Meta 旗下所有應用程式中,單憑其龐大的分發能力就成為全球部署最廣泛的 AI 助理之一。Zuckerberg 也積極表達其哲學立場:AI 模型應該開放,AI 權力集中在封閉實驗室手中是危險的,Meta 的開放路線對生態系統更好。這究竟是真心信念還是針對 OpenAI 和 Google(Meta 可以用免費替代方案來削弱其封閉模型)的競爭策略,至今仍是熱議話題。
除了大型語言模型,Meta AI 的研究範疇之廣令人矚目。他們在電腦視覺(DINOv2、Segment Anything)、語音與翻譯(SeamlessM4T,涵蓋 100 多種語言)、影片生成以及具身 AI 等領域的研究成果均屬業界頂尖。2023 年發布的 Segment Anything Model(SAM)之於影像分割,就如同 AlphaFold 之於蛋白質折疊 —— 它讓一項原本困難的任務變得唾手可得且免費使用。FAIR 現由 Joelle Pineau 領導(LeCun 以首席 AI 科學家的諮詢身份留任),持續以驚人的速度發表研究。Meta 面臨的策略挑戰是整合:如何將所有這些研究轉化為使其社群平台更具吸引力、廣告更加精準的產品,同時避免引發監管反彈 —— 鑑於 Meta 在隱私方面的歷史紀錄,他們特別容易受到此類風險的影響。開放權重策略也有其限制 —— 當模型趨近 AGI 等級的能力時,是否應該公開釋出就成了更難回答的問題。