La empresa de ML robótica Generalist anunció GEN-1, afirmando que su sistema de AI física logra tasas de éxito del 99% en tareas delicadas como doblar cajas, empacar teléfonos y dar servicio a aspiradoras robóticas. El modelo supuestamente alcanza confiabilidad de nivel de producción después de solo una hora de adaptación a hardware robótico específico, funcionando tres veces más rápido que su modelo GEN-0 anterior. Generalist entrenó GEN-1 usando "data hands" — sensores portátiles que capturaron más de 500,000 horas de datos de manipulación humana.

Esto importa porque la robótica ha sido el cementerio de las promesas de AI por décadas. A diferencia de los modelos de lenguaje que pueden entrenar con texto de internet, la AI física necesita datos de interacción del mundo real que son costosos y lentos de recolectar. Si Generalist realmente resolvió el problema de datos con su enfoque de sensores y logró una confiabilidad genuina del 99%, eso es un avance. Pero la palabra clave es "si" — estas son afirmaciones extraordinarias de una empresa con incentivos obvios para sobrevender sus capacidades.

La parte preocupante: solo tenemos la palabra de Generalist y videos de demostración cuidadosamente seleccionados que muestran robots ajustándose a disrupciones como objetos moviéndose a mitad de tarea. Sin verificación independiente, sin comparación con sistemas existentes, sin discusión de modos de falla o casos extremos. La entrevista de Forbes menciona improvisación como sacudir una bolsa para ayudar a que caiga un juguete, pero ejemplos anecdóticos no son datos. La robótica de producción real requiere confiabilidad a través de miles de casos extremos, no éxitos seleccionados cuidadosamente.

Los desarrolladores deberían mantenerse escépticos hasta que veamos pruebas independientes, documentación clara de tasas de falla y datos reales de implementación. La industria robótica está llena de demos que se veían increíbles pero no podían manejar el caos del mundo real. Si GEN-1 cumple sus promesas, podría acelerar la automatización robótica en manufactura y logística. Pero afirmaciones extraordinarias demandan evidencia extraordinaria.