Un estudiante de medicina en Nigeria llamado Zeus se amarra un iPhone a la frente cada noche y se graba doblando ropa por $15 la hora. Es uno de miles de trabajadores por contrato en más de 50 países contratados por la startup de Palo Alto Micro1 para crear datos de entrenamiento para robots humanoides. Tesla, Figure AI y Agility Robotics están comprando este material para enseñar a sus robots movimientos humanos básicos—de la misma manera que ChatGPT aprendió lenguaje del texto de internet.
Esto representa un cambio fundamental en el entrenamiento robótico. Por décadas, los ingenieros programaron robots con instrucciones explícitas. Ahora están apostando a que los robots pueden aprender manipulación similar a la humana observando millones de horas de humanos reales haciendo tareas mundanas. El enfoque refleja cómo funcionan los LLMs, pero los datos del mundo físico son exponencialmente más difíciles de recolectar que el texto. Las simulaciones virtuales pueden enseñar a los robots a hacer volteretas pero no pueden modelar con precisión la física de agarrar una taza de café o doblar una sábana ajustable.
Lo que el reporte original no captura completamente es cómo esto crea una nueva categoría de trabajo de IA—generación de datos físicamente encarnados. A diferencia del trabajo remoto típico, estos empleos requieren que los trabajadores realicen movimientos precisos y repetitivos mientras mantienen ángulos de cámara e iluminación. Zeus encuentra el trabajo aburrido a pesar del buen pago, destacando una tensión entre oportunidad económica y satisfacción laboral que probablemente definirá muchos roles temporales relacionados con IA.
Para desarrolladores construyendo aplicaciones robóticas, esto señala que los datos de entrenamiento se están convirtiendo en el cuello de botella, no el cómputo o algoritmos. Si estás trabajando en IA encarnada, empieza a pensar en tu pipeline de datos ahora—los datos de demostración humana de calidad serán costosos y tomarán tiempo adquirir a escala.
