Meta發表了Muse Spark,這是一個多模態推理模型,具備工具使用、視覺思維鏈和多智能體編排能力。該模型目前為Meta的AI應用和網站提供支援,計劃在未來幾週內推廣到WhatsApp、Instagram、Facebook、Messenger和AI眼鏡。Meta將此定位為透過其新成立的Superintelligence Labs部門邁向「個人超級智能」的「第一步」,並得到包括Hyperion資料中心在內的戰略基礎設施投資的支持。

「個人超級智能」的說法是Meta經典的行銷炒作,但技術主張值得關注。具有原生工具整合的多模態推理代表了超越基於聊天模型的重要進展。Meta在整個生態系統中部署的能力——超過30億用戶——為他們提供了純AI公司缺乏的分發優勢。然而,Meta承認在長期智能體系統和編碼工作流程方面存在「目前效能差距」,這些領域目前由OpenAI和Anthropic領先。

Meta的私有API預覽表明其企業雄心超越了消費者應用。公司從底層重建AI技術堆疊的做法表明,他們正大力押注垂直整合,而不是依賴第三方基礎設施。這反映了他們在React、PyTorch和其他開發者工具方面的歷史做法——內部構建,然後戰略性開源。

對於開發者來說,有趣的問題不是Meta的超級智能時間表,而是Muse Spark的多模態能力是否值得從現有提供商切換。真正的考驗將在私有API開放時到來,屆時我們可以在實際生產工作負載上對比GPT-4V、Claude 3和Gemini Pro的效能。