Google DeepMind lanzó Gemini Robotics, un modelo Vision-Language-Action construido sobre Gemini 2.0 que afirma controlar directamente robots en diferentes plataformas de hardware. El sistema puede manejar tareas de manipulación complejas como doblar origami y jugar cartas, adaptarse a nuevas encarnaciones robóticas incluyendo plataformas de doble brazo, y aprender nuevas tareas con tan pocas como 100 demostraciones. DeepMind dice que funciona con entornos no vistos y sigue instrucciones de vocabulario abierto mientras ejecuta "movimientos suaves y reactivos".

Esto representa el empuje más agresivo de Google hacia la IA encarnada, yendo más allá de chatbots hacia el control del mundo físico. El timing no es coincidencial—las empresas de robótica están compitiendo para resolver el problema de integración hardware-software que ha mantenido robots útiles fuera de entornos reales. El enfoque de DeepMind de entrenar un modelo generalista que se adapte a cualquier cuerpo robótico podría resolver el problema de fragmentación que ha plagado la robótica durante décadas.

Mientras tanto, investigadores en KAIST lanzaron Robot-R1, tomando un enfoque diferente con aprendizaje por refuerzo en lugar de fine-tuning supervisado. Argumentan que los métodos de entrenamiento tradicionales llevan a "olvido catastrófico y rendimiento de generalización reducido" en tareas robóticas. Robot-R1 aprende a predecir estados de puntos clave para completar tareas, inspirado por el enfoque de razonamiento de DeepSeek-R1. Las metodologías competidoras destacan la incertidumbre continua sobre el mejor camino hacia la robótica de propósito general.

Para los desarrolladores, la pregunta práctica es si estos modelos realmente se enviarán como API que puedas usar, o permanecerán como demos de investigación. El historial de DeepMind sugiere optimismo cauteloso—han entregado modelos de producción antes, pero la robótica ha quemado miles de millones en hype. La prueba real es si Gemini Robotics funciona lo suficientemente confiable para que alguien apueste su producto en ello.