Origin Lab 周三宣布完成 800 万美元的 seed 轮,由 Lightspeed Ventures 领投,SV Angel、Eniac、Seven Stars、FPV 跟投,另有 Twitch 联合创办人 Kevin Lin 和 Cruise 创办人 Kyle Vogt 的 angel 支票。产品是一个市场:电玩工作室出售对其 assets 与游戏画面的授权访问,world-model 实验室买训练数据,Origin 居中把游戏内的产物转换成可被模型摄入的形态——rendering 跑流、walkthrough 自动捕获、assets 提取。共同执行长 Anne-Margot Rodde 在 TechCrunch 报道里点名两位具体买家:Yann LeCun 的 AMI Labs 与 Fei-Fei Li 的 World Labs。pitch 是结构性的,不是创新——world models 需要物体在空间中运动的资料,游戏引擎大规模产生这类资料,但此前没有授权渠道让实验室在不承担法律暴露的前提下获取——直到现在。
2024 年 12 月的 Sora-Twitch 事件是前面的收据。OpenAI 第一版 Sora 看起来在反吐流行游戏与 Twitch 主播的画面,暗示模型曾被训练在被刮取的串流内容上——当时是小型丑闻,但结构上是个承认:前沿实验室已经在没有授权的情况下挖掘游戏画面。Amazon 公开过其对 Twitch 派生训练数据的兴趣。Origin Lab 的提议,是把这种安静、法律暴露的刮取转换成有明确授权的清算所——这与 Getty Images 和 Shutterstock 在 2024 年对生成式图像实验室所推的弧线相同。Lightspeed 的 Faraz Fatemi 把背后的资本市场逻辑讲得很直白:"我们已经看到,服务大实验室的数据 vendor 收入扩张可以多么锋利。这些都是非常资本充足的企业,而它们所有人的瓶颈都是数据。"
这里的生态读法是:world-model 数据是 embodied AI 这一切的底层。本周早些时候报道的宇树 1.5 万美元 G1 人形,需要一个 vision-language-action policy 才能做任何有用的事;这个 policy 需要一个理解物理动力学的 world model;这个模型需要训练数据带物体运动、表面摩擦、遮挡、光照变化——这正是游戏引擎跑 gameplay 时作为副产品产出的。Sora 事件表明实验室已经在拿这些数据了;Origin Lab 押注的是 procurement 功能从"刮 Twitch 加祈祷"切换到"向 Origin 买授权打包"。点名 LeCun 与 Li 是最重要的一笔——world-model 领域最具信誉的两家实验室愿意被点名为买家,是可能拿到的最强 early validation。
对在做物理 AI、机器人、视频生成的 builder:跟踪哪些游戏工作室真的与 Origin Lab 签约——Epic、Unity、Take-Two 与大发行商对玩家生成内容 vs 引擎输出的 IP 立场非常不同,首批合作关系会揭示谁真的愿意授权。对所有人来说,底下的信号是:AI 训练数据这一层正在分叉为专门 vendor——Scale 与 Surge 做人工标注偏好数据,Common Crawl 与 Books3 后继者做文本,现在 Origin Lab(加上很可能的竞争对手)做空间/动力学数据。曾经驱动第一代 transformer 浪潮的"一切都是文本"假设不再是瓶颈;拿到规模化的、有授权的运动数据才是。Origin 的 800 万美元 seed 体量小,但它指向的 procurement 模式很大。
