机器人ML公司Generalist发布了GEN-1,声称他们的物理AI系统在精细任务(如折叠盒子、包装手机和维护扫地机器人)上达到99%的成功率。该模型据称在仅适应特定机器人硬件一小时后就能达到生产级别的可靠性,运行速度比他们之前的GEN-0模型快三倍。Generalist使用"数据手套"训练GEN-1——可穿戴传感器捕获了超过50万小时的人类操作数据。

这很重要,因为几十年来机器人技术一直是AI承诺的坟墓。与可以用互联网文本训练的语言模型不同,物理AI需要真实世界的交互数据,这些数据收集起来既昂贵又缓慢。如果Generalist真的用他们的传感器方法解决了数据问题并达到了真正的99%可靠性,那就是一个突破。但关键词是"如果"——这些是来自一家明显有动机夸大其能力的公司的非凡声明。

令人担忧的部分:我们只有Generalist的说辞和精心策划的演示视频,显示机器人适应干扰(如任务进行中物体移动)。没有独立验证,没有与现有系统的比较,没有对失效模式或边缘情况的讨论。Forbes采访中提到了即兴发挥,比如摇晃袋子帮助玩具掉进去,但轶事例子不是数据。真正的生产机器人技术需要在数千种边缘情况下的可靠性,而不是精挑细选的成功案例。

开发者应该保持怀疑态度,直到我们看到独立测试、明确的故障率文档和实际部署数据。机器人行业充斥着看起来很棒但无法处理现实世界混乱的演示。如果GEN-1兑现其承诺,它可能会加速制造和物流领域的机器人自动化。但非凡的声明需要非凡的证据。