Galaxy Universal Robotics是一家中國人形機器人公司,已開源AstraBrain-WBC 0.5,它將其描述為人形機器人的通用小腦。機器人的大腦負責高層次的規劃,而小腦則是真正驅動身體運動的那一層,這個模型在保持機器穩定的同時,協調全身、跨29 degrees自由度的即時運動。該公司稱其為首個能在這種參數規模下運作的人形全身即時控制模型,而那個數字正是令人意外之處:8040萬參數,小到足以在單張RTX 4090上以不到1.5毫秒的時間運行。
該模型是在該公司所稱同類中最大的人類動作資料集上訓練而成,約20億幀,涵蓋約20,000 hours的動作。資料橫跨舞蹈、運動、日常行為、工業操作以及雙人協作搬運,其構想是:一個接觸過如此廣泛人類動作的控制器,學到的是移動身體的一般原理,而非一份固定的動作清單。
最引人注目的成果是零樣本泛化。該公司展示了模型執行訓練資料中不存在的複雜動作,包括籃球動作、拳擊、舞蹈、翻筋斗以及與夥伴協調搬運,且未針對其中任何一項重新訓練。從動作捕捉到機器人,整條流程端到端在不到20毫秒內運行。泛化到未見過的動作是人形控制中最困難的部分,大多數系統都是逐項技能調校的,因此單一模型即興產生新的全身動作正是值得關注的宣稱。
讓它不只是一場展示的,是論文、程式碼與結果完全開源。這與當前的主流方向相反,在那個方向中,最有能力的機器人基礎模型都是專有的,並與特定平台綁定,而這意味著外部研究者真的能在自己的硬體上測試這些零樣本宣稱是否成立。一個能在單張消費級GPU上運行的小模型,也降低了把有能力的控制放上真實機器人(而非伺服器)的門檻。
對於這樣一次發布,需要注意的事項一如既往。這些數字與全球首創的說法來自該公司自己的公告,展示是經過挑選的,而受控環境下的結果能多好地遷移到雜亂的真實世界任務,正是重現實驗將會決定的。但這場賭注的形態才是有趣的部分,而它與當下背道而馳:不是一個巨型專有大腦,而是一個任何人都能下載並試用的小巧、高效、開放的控制器。如果零樣本泛化站得住腳,那麼用更少的參數做更多的機器人運動,會是比用更多參數做更有用的方向。
