NVIDIA Research在ICRA 2026上发表28篇论文,其中8篇专门针对仿真到现实迁移,这是让具身AI停留在demo状态的瓶颈。从命名论文中的具体数字:COMPASS在Isaac Lab中通过residual RL显示比imitation learning平均成功率提升4.5×,真实机器人上约80%,无需真实世界数据。Grasp-MPC报告真实机器人上整体成功率75%对比41%基线,使用cuRobo和GraspGen在8,000个物体上进行了200万个模拟轨迹训练。PEEK报告仅sim策略在真实世界精度提升41×,VLA模型2-3.5×增益,通过视觉-语言模型在图像层级引导。

这些数字之下的stack故事是对考虑具身AI的构建者真正重要的。NVIDIA的Isaac Lab是仿真环境;cuRobo处理运动规划;GraspGen提供抓取数据集;Jetson运行on-robot推理。这8篇论文正在将这个stack从"昂贵的PhD项目"带向"工业流程"——制药多臂协调3×加速(Jetson上的ScheduleStream)、精密装配成功率38%提升和周期时间30%降低(SPARR)、多步装配仿真成功率91%以及对baseline约11%提升(Refinery)、runtime候选动作验证最多15%增益(SEAL),以及通过从生物生长方程生成的合成树zero-shot迁移到真实树枝(Deformable Cluster Manipulation)。训练计算是非trivial的(200万轨迹×8K物体)但结果策略迁移无需真实世界数据收集,这才是真正的成本节省。

对构建者的生态系统解读:"仿真中的机器人很容易,现实中的机器人很难"的差距正在缩小,方法学正在汇聚于一个共同stack。域随机化仍是基础,但该领域正在叠加residual policy learning(COMPASS)、实时运动校正(SPARR、Grasp-MPC)和VLM引导的感知(PEEK)。NVIDIA stack是事实参考实现,因为组件是开放或可用的,不是因为vendor锁定。诚实的警告:PEEK的41×数字是关于在真实世界接近零的仅sim策略,所以绝对起点重要;大多数baseline是NVIDIA自己先前工作的内部数字,不是与其他机器人框架的head-to-head;论文是blog-summarized,在撰写时尚未通过同行评审。值得追踪哪些数字在ICRA讨论中存活。

如果你周一早上构建机器人应用:sim-to-real配方现在足够可重现,以使domain-randomization-plus-VLM-guidance成为default起点,而不是研究方向。如果你为机器人startup提供资金:今年将操控或抓取策略从sim带到可部署的成本曲线缩小——杂乱中新物体的75%真实世界抓取成功率是要标记的实用里程碑。