Meta发布了Muse Spark,这是一个多模态推理模型,具备工具使用、视觉思维链和多智能体编排能力。该模型目前为Meta的AI应用和网站提供支持,计划在未来几周内推广到WhatsApp、Instagram、Facebook、Messenger和AI眼镜。Meta将此定位为通过其新成立的Superintelligence Labs部门迈向「个人超级智能」的「第一步」,并得到包括Hyperion数据中心在内的战略基础设施投资的支持。

「个人超级智能」的说法是Meta经典的营销炒作,但技术主张值得关注。具有原生工具集成的多模态推理代表了超越基于聊天模型的重要进步。Meta在整个生态系统中部署的能力——超过30亿用户——为他们提供了纯AI公司缺乏的分发优势。然而,Meta承认在长期智能体系统和编码工作流程方面存在「当前性能差距」,这些领域目前由OpenAI和Anthropic领先。

Meta的私有API预览表明其企业雄心超越了消费者应用。公司从底层重建AI技术栈的做法表明,他们正大力押注垂直整合,而不是依赖第三方基础设施。这反映了他们在React、PyTorch和其他开发者工具方面的历史做法——内部构建,然后战略性开源。

对于开发者来说,有趣的问题不是Meta的超级智能时间表,而是Muse Spark的多模态能力是否值得从现有提供商切换。真正的考验将在私有API开放时到来,届时我们可以在实际生产工作负载上对比GPT-4V、Claude 3和Gemini Pro的性能。