一位名叫Zeus的尼日利亚医学生每晚将iPhone绑在额头上,录制自己叠衣服的过程,时薪15美元。他是Palo Alto初创公司Micro1在50多个国家雇佣的数千名合同工之一,为人形机器人创建训练数据。Tesla、Figure AI和Agility Robotics正在购买这些视频来教授其机器人基本的人类动作——就像ChatGPT从互联网文本中学习语言一样。

这代表了机器人训练的根本性转变。几十年来,工程师用明确的指令对机器人进行编程。现在他们押注机器人可以通过观看数百万小时真实人类执行日常任务来学习类人操作。这种方法类似LLMs的工作原理,但物理世界的数据比文本数据难收集得多。虚拟仿真可以教机器人做后空翻,但无法准确建模抓取咖啡杯或叠床单的物理过程。

原始报道没有完全捕捉到的是,这创造了一个新的AI劳动类别——物理具身数据生成。与典型的远程工作不同,这些工作要求工人执行精确、重复的动作,同时保持摄像角度和照明。Zeus发现这份工作很无聊,尽管薪水不错,这突出了经济机会与工作满意度之间的紧张关系,这可能会定义许多与AI相关的零工角色。

对于构建机器人应用的开发者来说,这表明训练数据正在成为瓶颈,而不是计算或算法。如果你正在从事具身AI工作,现在就开始考虑你的数据管道——高质量的人类演示数据在大规模获取时将是昂贵且耗时的。