NVIDIA Research在ICRA 2026上發表28篇論文,其中8篇專門針對模擬到現實遷移,這是讓具身AI停留在demo狀態的瓶頸。從命名論文中的具體數字:COMPASS在Isaac Lab中透過residual RL顯示比imitation learning平均成功率提升4.5×,真實機器人上約80%,無需真實世界資料。Grasp-MPC回報真實機器人上整體成功率75%對比41%基線,使用cuRobo和GraspGen在8,000個物體上進行了200萬個模擬軌跡訓練。PEEK回報僅sim策略在真實世界精度提升41×,VLA模型2-3.5×增益,透過視覺-語言模型在圖像層級引導。

這些數字之下的stack故事是對考慮具身AI的建構者真正重要的。NVIDIA的Isaac Lab是模擬環境;cuRobo處理運動規劃;GraspGen提供抓取資料集;Jetson執行on-robot推理。這8篇論文正在將這個stack從「昂貴的PhD專案」帶向「工業流程」——製藥多臂協調3×加速(Jetson上的ScheduleStream)、精密裝配成功率38%提升和週期時間30%降低(SPARR)、多步裝配模擬成功率91%以及對baseline約11%提升(Refinery)、runtime候選動作驗證最多15%增益(SEAL),以及透過從生物生長方程生成的合成樹zero-shot遷移到真實樹枝(Deformable Cluster Manipulation)。訓練運算是非trivial的(200萬軌跡×8K物體)但結果策略遷移無需真實世界資料收集,這才是真正的成本節省。

對建構者的生態系統解讀:「模擬中的機器人很容易,現實中的機器人很難」的差距正在縮小,方法學正在匯聚於一個共同stack。域隨機化仍是基礎,但該領域正在疊加residual policy learning(COMPASS)、即時運動校正(SPARR、Grasp-MPC)和VLM引導的感知(PEEK)。NVIDIA stack是事實參考實作,因為元件是開放或可用的,不是因為vendor鎖定。誠實的警告:PEEK的41×數字是關於在真實世界接近零的僅sim策略,所以絕對起點重要;大多數baseline是NVIDIA自己先前工作的內部數字,不是與其他機器人框架的head-to-head;論文是blog-summarized,在撰寫時尚未通過同行評審。值得追蹤哪些數字在ICRA討論中存活。

如果你週一早上建構機器人應用:sim-to-real配方現在足夠可重現,以使domain-randomization-plus-VLM-guidance成為default起點,而不是研究方向。如果你為機器人startup提供資金:今年將操控或抓取策略從sim帶到可部署的成本曲線縮小——雜亂中新物體的75%真實世界抓取成功率是要標記的實用里程碑。