Origin Lab 週三宣布完成 800 萬美元的 seed 輪,由 Lightspeed Ventures 領投,SV Angel、Eniac、Seven Stars、FPV 跟投,另有 Twitch 共同創辦人 Kevin Lin 和 Cruise 創辦人 Kyle Vogt 的 angel 支票。產品是一個市場:電玩工作室出售對其 assets 與遊戲畫面的授權存取,world-model 實驗室買訓練資料,Origin 居中把遊戲內的產物轉換成可被模型攝入的形態——rendering 跑流、walkthrough 自動擷取、assets 提取。共同執行長 Anne-Margot Rodde 在 TechCrunch 報導裡點名兩位具體買家:Yann LeCun 的 AMI Labs 與 Fei-Fei Li 的 World Labs。pitch 是結構性的,不是創新——world models 需要物體在空間中運動的資料,遊戲引擎大規模產生這類資料,但此前沒有授權渠道讓實驗室在不承擔法律暴露的前提下取得——直到現在。

2024 年 12 月的 Sora-Twitch 事件是前面的收據。OpenAI 第一版 Sora 看起來在反吐流行遊戲與 Twitch 主播的畫面,暗示模型曾被訓練在被抓取的串流內容上——當時是小型醜聞,但結構上是個承認:前沿實驗室已經在沒有授權的情況下挖掘遊戲畫面。Amazon 公開過其對 Twitch 衍生訓練資料的興趣。Origin Lab 的提議,是把這種安靜、法律暴露的抓取轉換成有明確授權的清算所——這與 Getty Images 和 Shutterstock 在 2024 年對生成式影像實驗室所推的弧線相同。Lightspeed 的 Faraz Fatemi 把背後的資本市場邏輯講得很直白:「我們已經看到,服務大實驗室的資料 vendor 營收擴張可以多麼鋒利。這些都是非常資本充足的企業,而它們所有人的瓶頸都是資料。」

這裡的生態讀法是:world-model 資料是 embodied AI 這一切的底層。本週早些時候報導的宇樹 1.5 萬美元 G1 人形,需要一個 vision-language-action policy 才能做任何有用的事;這個 policy 需要一個理解物理動力學的 world model;這個模型需要訓練資料帶物體運動、表面摩擦、遮擋、光照變化——這正是遊戲引擎跑 gameplay 時作為副產品產出的。Sora 事件表明實驗室已經在拿這些資料了;Origin Lab 押注的是 procurement 功能從「抓 Twitch 加祈禱」切換到「向 Origin 買授權打包」。點名 LeCun 與 Li 是最重要的一筆——world-model 領域最具信譽的兩家實驗室願意被點名為買家,是可能拿到的最強 early validation。

對在做物理 AI、機器人、影片生成的 builder:追蹤哪些遊戲工作室真的與 Origin Lab 簽約——Epic、Unity、Take-Two 與大發行商對玩家生成內容 vs 引擎輸出的 IP 立場非常不同,首批合作關係會揭示誰真的願意授權。對所有人來說,底下的訊號是:AI 訓練資料這一層正在分叉為專門 vendor——Scale 與 Surge 做人工標註偏好資料,Common Crawl 與 Books3 後繼者做文本,現在 Origin Lab(加上很可能的競爭對手)做空間/動力學資料。曾經驅動第一代 transformer 浪潮的「一切都是文本」假設不再是瓶頸;拿到規模化的、有授權的運動資料才是。Origin 的 800 萬美元 seed 體量小,但它指向的 procurement 模式很大。