Generalist AI Inc. 發布了 GEN-1,這是他們的第二個機器人基礎模型,距離推出 GEN-0 僅僅五個月。該公司聲稱 GEN-1 為物理任務提供「高度能力」的機器人學習,儘管他們沒有提供任何關於實際改進了什麼或如何對標 benchmarks 效能的技術細節。

在機器人技術領域,主要模型發佈間隔五個月要麼真的令人印象深刻,要麼就是行銷表演。雖然語言模型可以在運算和資料上快速迭代,但機器人模型需要現實世界的驗證——你不能簡單地向一個需要在不破壞物體的情況下操縱物體的機器人投入更多 GPUs。Tesla 已經在他們的機器人 AI 上工作了多年。Boston Dynamics 有幾十年的經驗。要麼 Generalist 找到了具身 AI 的突破性方法,要麼他們在將漸進式更新重新包裝為基礎模型發佈。

其他 AI 媒體缺乏額外報導是很說明問題的。沒有技術論文,沒有 benchmark 比較,沒有實際能力展示。當 OpenAI 發佈模型時,整個 AI 社群會在幾小時內分析它。當 Anthropic 發佈 Claude 更新時,我們會得到詳細的技術部落格。Generalist 在聲稱「高度能力」效能的同時對具體細節保持沉默,這引起了警覺。

對於構建機器人應用程式的開發者,在興奮之前等待實際的技術文件。機器人基礎模型需要在操縱任務、導航和現實世界強健性上證明自己——而不僅僅是行銷宣傳。如果 GEN-1 真的有能力,我們很快就會看到第三方驗證和整合機會。