A Galaxy Universal Robotics, uma empresa chinesa de robotica humanoide, abriu o codigo do AstraBrain-WBC 0.5, um modelo de base que ela descreve como um cerebelo de proposito geral para robos humanoides. Enquanto o cerebro de um robo cuida do planejamento de alto nivel, o cerebelo e a camada que de fato move o corpo, e este coordena o movimento de corpo inteiro em tempo real ao longo de 29 graus de liberdade, mantendo a maquina equilibrada. A empresa o chama de primeiro modelo de controle em tempo real de corpo inteiro para humanoides a funcionar nesta escala de parametros, e o numero e a surpresa: 80,4 milhoes de parametros, pequeno o suficiente para rodar em menos de 1.5 milissegundos numa unica RTX 4090.

O modelo foi treinado com o que a empresa diz ser o maior conjunto de dados de movimento humano de seu tipo, cerca de 2 bilhoes de quadros cobrindo aproximadamente 20,000 horas de movimento. Os dados abrangem danca, esportes, comportamento cotidiano, operacoes industriais e transporte colaborativo em dupla, com a ideia de que um controlador exposto a essa amplitude de movimento humano aprende principios gerais de mover um corpo, em vez de uma lista fixa de rotinas.

O resultado principal e a generalizacao zero-shot. A empresa mostra o modelo executando acoes complexas que nao estavam em seus dados de treinamento, incluindo movimentos de basquete, boxe, danca, cambalhotas e transporte coordenado com um parceiro, sem ser retreinado para nenhuma delas. De ponta a ponta, da captura de movimento ate o robo, o pipeline roda em menos de 20 milissegundos. Generalizar para movimentos nunca vistos e a parte dificil do controle de humanoides, em que a maioria dos sistemas e ajustada habilidade por habilidade, de modo que um unico modelo improvisando novas acoes de corpo inteiro e a afirmacao que vale a pena acompanhar.

O que o torna mais do que uma demonstracao e que o artigo, o codigo e os resultados estao totalmente abertos. Isso e o oposto da direcao predominante, na qual os modelos de base roboticos mais capazes sao proprietarios e atrelados a uma plataforma especifica, e significa que pesquisadores externos podem de fato testar se as afirmacoes de zero-shot se sustentam em seu proprio hardware. Um modelo pequeno que roda numa unica GPU de consumo tambem reduz a barreira para colocar controle capaz num robo real, em vez de num servidor.

As ressalvas sao as de sempre para um lancamento como este. Os numeros e o enquadramento de pioneirismo mundial vem do anuncio da propria empresa, as demonstracoes sao selecionadas, e o quanto resultados de ambiente controlado se transferem para tarefas confusas do mundo real e exatamente o que a reproducao vai decidir. Mas o formato da aposta e a parte interessante, e ele vai contra o momento: nao um cerebro proprietario gigantesco, mas um controlador pequeno, eficiente e aberto que qualquer um pode baixar e experimentar. Se a generalizacao zero-shot se confirmar, fazer mais do movimento robotico com menos parametros e uma direcao mais util do que faze-lo com mais.