Origin Lab a annoncé mercredi une levée seed de 8 M$, menée par Lightspeed Ventures avec SV Angel, Eniac, Seven Stars et FPV, plus des chèques angel du cofondateur de Twitch Kevin Lin et du fondateur de Cruise Kyle Vogt. Le produit est une place de marché : les studios de jeux vidéo vendent un accès sous licence à leurs assets et footage de gameplay, les labos world-model achètent des données d'entraînement, et Origin se tient au milieu pour convertir les artefacts de jeu en forme ingestible par les modèles — runs de rendering, capture automatisée de walkthrough, extraction d'assets. La co-CEO Anne-Margot Rodde a nommé deux acheteurs spécifiques dans le morceau de TechCrunch : AMI Labs de Yann LeCun et World Labs de Fei-Fei Li. Le pitch est structurel plutôt que nouveau : les world models ont besoin de données sur comment les objets bougent dans l'espace, les moteurs de jeu produisent ces données à l'échelle, et il n'y avait pas de canal sous licence — jusqu'à maintenant — pour que les labos y accèdent sans exposition juridique.

L'incident Sora-Twitch de décembre 2024 est le reçu précédent. La première sortie de Sora d'OpenAI semblait régurgiter du footage de jeux vidéo populaires et de streamers Twitch, suggérant que le modèle avait été entraîné sur du contenu de stream scrapé — un mini scandale à l'époque mais un aveu structurel que les labos frontières minaient déjà le footage de jeu sans licence. Amazon a été publiquement ouvert sur son intérêt pour les données d'entraînement dérivées de Twitch. La proposition d'Origin Lab, c'est de convertir ce scraping silencieux et juridiquement exposé en une chambre de compensation avec licences explicites, ce qui est le même arc que Getty Images et Shutterstock ont poussé sur les labos d'image générative en 2024. Faraz Fatemi chez Lightspeed a mis la logique de marchés de capitaux en termes simples : « On a vu à quel point le scaling de revenu peut être tranchant pour des vendors de données qui servent les grands labos. Ce sont des business très bien capitalisés, et le goulet pour eux tous, c'est les données. »

La lecture écosystémique ici, c'est que les données de world-model sont la couche sous tout ce qui intéresse les builders en IA embarquée. Le humanoid G1 à 15 000 $ d'Unitree (couvert plus tôt cette semaine) a besoin d'une policy vision-langage-action pour faire quoi que ce soit d'utile ; cette policy a besoin d'un world model qui comprend la dynamique physique ; ce modèle a besoin de données d'entraînement avec du mouvement d'objets, de la friction de surface, de l'occlusion, de la variation de lumière — exactement ce que les moteurs de jeu produisent comme sous-produit de l'exécution du gameplay. L'incident Sora a montré que les labos prenaient déjà ces données ; Origin Lab parie que la fonction procurement passe de « scrape Twitch et espère » à « achète un bundle sous licence d'Origin ». Le nommage de LeCun et Li est la partie qui compte le plus — deux des labos les plus crédibles du domaine world-model sont prêts à être cités comme acheteurs, ce qui est la plus forte validation early possible.

Pour les builders qui travaillent sur l'IA physique, la robotique, ou la génération vidéo : surveille quels studios de jeux signent réellement avec Origin Lab — Epic, Unity, Take-Two et les grands éditeurs ont des positions IP très différentes sur le contenu généré par les joueurs versus la sortie de moteur, et la première vague de partenariats révélera qui est réellement prêt à licencier. Pour tout le monde, le signal sous-jacent, c'est que la couche données d'entraînement IA se bifurque en vendors spécialisés : Scale et Surge pour les données de préférence labellisées par des humains, Common Crawl et les successeurs de Books3 pour le texte, et maintenant Origin Lab (plus de probables concurrents) pour les données spatiales/dynamiques. L'hypothèse « tout est texte » qui a alimenté la première vague transformer n'est plus le goulet ; obtenir des données de mouvement à l'échelle et sous licence l'est. Le seed de 8 M$ d'Origin est petit, mais le pattern de procurement vers lequel il pointe est grand.