NVIDIA Research está presentando 28 papers en ICRA 2026 con 8 específicamente apuntando a la transferencia simulación-a-real, el cuello de botella que ha mantenido la IA encarnada en estado demo. Números concretos de los papers nombrados: COMPASS muestra 4.5× de mejora en tasa promedio de éxito vs imitation learning con ~80% en robots reales vía RL residual en Isaac Lab sin datos del mundo real. Grasp-MPC reporta 75% de éxito general en robots reales vs 41% baseline, entrenado sobre 2 millones de trayectorias simuladas a través de 8.000 objetos usando cuRobo y GraspGen. PEEK reporta 41× de mejora de accuracy en mundo real sobre políticas solo-sim y ganancias de 2-3.5× para modelos VLA, vía guidance de modelo visión-lenguaje a nivel imagen.

La historia de la stack debajo de estos números es lo que importa para constructores considerando IA encarnada. Isaac Lab de NVIDIA es el entorno de simulación; cuRobo maneja la planificación de movimiento; GraspGen provee datasets de grasping; Jetson corre inferencia on-robot. Los 8 papers están llevando esta stack de "proyecto PhD costoso" a "proceso industrial" — coordinación multi-brazo farma a 3× speedup (ScheduleStream en Jetson), ensamblaje preciso con 38% de mejora en tasa de éxito y 30% de reducción de tiempo de ciclo (SPARR), ensamblaje multi-paso a 91% de éxito en simulación y ~11% de mejora sobre baselines (Refinery), verificación de candidatos de acción en runtime con hasta 15% de ganancias (SEAL), y transferencia zero-shot a ramas de árbol reales vía árboles sintéticos generados desde ecuaciones de crecimiento biológico (Deformable Cluster Manipulation). El compute de entrenamiento es no-trivial (2M trayectorias × 8K objetos) pero las políticas resultantes transfieren sin recolección de datos del mundo real, lo cual es el verdadero ahorro de costo.

La lectura de ecosistema para constructores: la brecha "los robots en simulación son fáciles, los robots en realidad son difíciles" se está cerrando, y la metodología está convergiendo en una stack común. La randomización de dominio sigue siendo la fundación, pero el campo está capeando con residual policy learning (COMPASS), corrección de movimiento en tiempo real (SPARR, Grasp-MPC), y percepción guiada por VLM (PEEK). La stack NVIDIA es la implementación de referencia de facto porque los componentes son abiertos o disponibles, no por vendor lock-in. Las advertencias honestas: el número 41× de PEEK es sobre políticas solo-sim que estaban cerca de cero en el mundo real, así el punto de partida absoluto importa; la mayoría de baselines son los propios números internos de NVIDIA de trabajos previos, no head-to-head contra otros frameworks de robótica; y los papers son blog-summarized, no aún pasados por peer review al momento de escribir. Vale la pena trackear qué números sobreviven a la discusión ICRA.

Si construyes aplicaciones de robótica el lunes por la mañana: la receta sim-to-real es ahora lo suficientemente reproducible para que domain-randomization-plus-VLM-guidance sea un punto de partida default, no una dirección de investigación. Si financias startups de robótica: la curva de costo para llevar una política de manipulación o grasping de sim a desplegable se redujo este año — el 75% de éxito de grasping en mundo real sobre objetos nuevos en clutter es el hito práctico a marcar.