Wired 的 Will Knight 探訪了 Eka,一家位於美國麻薩諸塞州劍橋市的機器人新創公司,由 MIT 教授 Pulkit Agrawal 與前 Google DeepMind 機器人研究員 Tuomas Haarnoja 共同創立。Knight 於 4 月 29 日報導,他親眼看到該公司的機械臂把燈泡轉進燈座、追著滾下桌的燈泡,並穩穩地從一堆陌生雜物裡抓起東西 —— 耳塞盒、髮刷、毛絨鑰匙串 —— 整個過程僅用一隻兩指夾爪。Knight 的定調:「寫機器人逾十年,從未見過一台動作如此自然」,以及「市面上數十款機械臂裡,沒有一台能轉燈泡。」Agrawal 與 Haarnoja 的賣點:靈巧性才是解鎖,靈巧性終於開始被攻克,「人類的手裡流過兆級美元」。他們認為自己已經走了一半。

靈巧性這個聲稱才是真正重要的部分,也恰是 Knight 文章在技術層面沒有給出實證的部分。我們看到了有說服力的影片 —— 機械臂去搆滾動的燈泡、從打滑中恢復、完成轉燈泡 —— 但沒有公開的基準、沒有對照實驗、沒有公開的架構。今天的機器人操作研究,大多走 Vision-Language-Action(VLA)基礎模型的路 —— RT-2、Octo、OpenVLA、RT-X —— 也就是 Scout AI 防務向 Fury 所屬的同一架構家族。Eka 尚未公開揭露他們究竟是在擴展某個現有 VLA 方法,還是自己從頭訓練。可觀察到的是:他們的機械臂在接觸失敗時(滾動的燈泡、滑掉的鑰匙)能在不重啟任務的前提下恢復 —— 這是你期望從「在操作過程中維持狀態」的模型那裡看到的行為,而不是在執行腳本化運動規劃的系統那裡看到的。這種「貫穿接觸的狀態恢復」,是靈巧性方向上正在被攻關的研究前沿。如果 Eka 真的把這件事做到穩定可重複,那就是這場演示背後的實質。

兩條值得關注的模式。第一,與人形機硬體的對照。本屆會話稍早,我們寫過 Japan Airlines 在羽田機場的人形機試點 —— 當時排演過的演示展示了一台 Unitree G1「踉蹌走向貨櫃並做出一個模糊的推一下姿勢」—— 貨櫃實際是在人類工人啟動輸送帶後才動的。那是一種「有硬體,無靈巧」。Eka 則是反過來 —— 桌面上的靈巧,但沒有移動。機器人市場已經清晰地分成兩半:「能搬動一具人形身體,但不能操作」與「能用固定臂操作,但不能移動」。誰先把兩者都做出來,就贏。第二,「機器人的 ChatGPT 時刻」這種敘事,如今已是業界標準 pitch。2026 年所有融資中的機器人新創公司,都用某個版本。這種敘事會真正落地,是在「能力突然超出預期」的那一刻 —— 這正是 ChatGPT 在 2022 年底所做的事。對機器人而言,這一刻就是:一個非專家能讓機器人去做一件不熟悉的操作任務,並且它能穩定完成。Eka 的演示在路上;它能否泛化到演示之外,是個開放問題。

對 builders,三件具體事情。第一,如果你處在機器人下游 —— UI、工具鏈、評估、模擬 —— 請假定靈巧性距離「能跑起來的生產部署」還有 2-3 年,但部署到來時它會更像「桌面機械臂做一個受限任務」,而不是人形機。不要先押人形機的時刻。第二,「學術派共同創辦人 + 前 DeepMind 研究員」這種組合,正是當前前沿機器人新創公司最常見的創辦人指紋 —— Skild AI、Physical Intelligence、Generalist Robotics,如今再加 Eka,都是這個畫像。如果你在投資或招聘,這種 pedigree 集中度本身就是訊號。第三,Eka 的 pitch 裡缺的細節,與每一家講機器人基礎模型故事的公司缺的細節是同一個:它在沒見過的物體、沒見過的任務上能不能泛化?誠實的測試不是「轉這顆燈泡」—— 而是「用十字螺絲起子轉一根一字螺絲」。等到那種演示再下注。