Dev Mandal, un étudiant de 20 ans à IIT Madras, a publié un dataset appelé 'computer-use-large' qui a déjà dépassé les 100 000 téléchargements sur Hugging Face. Le dataset capture les interactions humaines avec l'ordinateur — captures d'écran, clics de souris, saisies au clavier — conçu spécifiquement pour entraîner les agents IA à contrôler les ordinateurs comme le font les humains.

Ça tombe pile au bon moment. L'IA de contrôle d'ordinateur, c'est la ruée vers l'or actuelle, avec Claude d'Anthropic qui mène la charge et OpenAI qui serait pas loin derrière selon les rumeurs. Mais ces modèles sont notoirement gourmands en données, pis les datasets de qualité sur le comportement informatique humain réel sont rares. La plupart des datasets existants sont soit synthétiques, limités en portée, ou verrouillés derrière des murs corporatifs.

Ce qui manque dans la couverture originale, c'est le contexte crucial sur la qualité des données et la méthodologie. Sans savoir comment Mandal a collecté ces interactions — est-ce que c'était du crowdsourcing ? À partir de vrais workflows ? Désinfecté pour la vie privée ? — c'est impossible de juger si ce dataset va vraiment faire bouger les choses. Les chiffres de téléchargement suggèrent que les développeurs sont assez désespérés pour ce type de données qu'ils vont essayer n'importe quoi, mais les téléchargements, ça équivaut pas au succès de déploiement.

Pour les développeurs qui construisent des agents de contrôle d'ordinateur, ça représente une occasion rare d'entraîner sur des patterns de comportement humain plutôt que sur des données synthétiques. Mais procédez avec prudence — inspectez la qualité des données à fond avant d'engager vos ressources d'entraînement. L'espace computer-use bouge assez vite qu'un dataset médiocre pourrait retarder votre projet de plusieurs semaines.