A empresa de ML robótica Generalist anunciou o GEN-1, alegando que seu sistema de AI física alcança taxas de sucesso de 99% em tarefas delicadas como dobrar caixas, embalar telefones e fazer manutenção em aspiradores robóticos. O modelo supostamente atinge confiabilidade de nível de produção após apenas uma hora de adaptação a hardware robótico específico, rodando três vezes mais rápido que seu modelo GEN-0 anterior. A Generalist treinou o GEN-1 usando "data hands" — sensores vestíveis que capturaram mais de 500.000 horas de dados de manipulação humana.

Isso importa porque a robótica tem sido o cemitério das promessas de AI por décadas. Diferente dos modelos de linguagem que podem treinar com texto da internet, AI física precisa de dados de interação do mundo real que são caros e lentos para coletar. Se a Generalist realmente resolveu o problema de dados com sua abordagem de sensores e atingiu confiabilidade genuína de 99%, isso é um avanço. Mas a palavra-chave é "se" — essas são alegações extraordinárias de uma empresa com incentivos óbvios para exagerar suas capacidades.

A parte preocupante: só temos a palavra da Generalist e vídeos de demonstração cuidadosamente selecionados mostrando robôs se ajustando a interrupções como objetos se movendo no meio da tarefa. Nenhuma verificação independente, nenhuma comparação com sistemas existentes, nenhuma discussão sobre modos de falha ou casos extremos. A entrevista da Forbes menciona improvisação como balançar uma sacola para ajudar um brinquedo a cair dentro, mas exemplos anedóticos não são dados. Robótica de produção real requer confiabilidade através de milhares de casos extremos, não sucessos cuidadosamente selecionados.

Desenvolvedores devem permanecer céticos até vermos testes independentes, documentação clara de taxas de falha e dados reais de implementação. A indústria robótica está cheia de demos que pareciam incríveis mas não conseguiam lidar com o caos do mundo real. Se o GEN-1 cumprir suas promessas, poderia acelerar a automação robótica em manufatura e logística. Mas alegações extraordinárias exigem evidências extraordinárias.