Thomas Dietterich — professeur émérite à Oregon State, sur le conseil consultatif éditorial d'arXiv et son équipe de modération — a posté sur X et Bluesky décrivant une nouvelle politique d'application : les manuscrits trouvés contenir du contenu AI-généré inapproprié résulteront en un ban de soumission d'un an pour chaque auteur listé, plus une exigence permanente que tout manuscrit futur passe peer-review formel à un journal avant qu'arXiv ne l'héberge. Les catégories que Dietterich nomme sont concrètes : « langage inapproprié, contenu plagié, contenu biaisé, erreurs, fautes, références incorrectes ou contenu trompeur ». Tous les auteurs d'un manuscrit sont responsables de son contenu sous ce framing — l'AI n'est pas la défense, l'auteur qui a pressé submit l'est. Caveat honnête en haut : c'est décrit par un modérateur, pas encore confirmé par le leadership d'arXiv. Ars Technica a tendu la main pour confirmation et n'a pas encore reçu de réponse au moment de l'écriture.

La raison pour laquelle ça atterrit plus dur qu'une mise à jour de politique normale c'est le rôle que arXiv joue dans la physique, l'astronomie et la recherche machine-learning. Dans ces domaines le preprint c'est partie du processus normal de publication — les chercheurs posent sur arXiv, collectent du feedback peer informel pendant des semaines ou des mois, puis itèrent vers une soumission journal formelle. Un ban de soumission d'un an enlève ce mécanisme entièrement pour l'auteur banni ; l'exigence permanente peer-review-first enlève la forme vitesse-et-feedback de la culture preprint même après que le ban se lève. Des sanctions sévères, en d'autres mots, calibrées sur la valeur que la plateforme fournit. Le grounding pour la politique c'est les standards de modération existants d'arXiv : « les soumissions à arXiv doivent se conformer aux standards appropriés de communication scientifique en forme... une scrupulosité et un soin général de préparation sont requis ». Le framing de Dietterich c'est que la nouvelle application c'est les standards de modération appliqués consistamment, pas une nouvelle règle de contenu.

Deux modes d'échec valent d'être signalés. Premier : le système peut être gamed en listant des auteurs innocents sur une soumission AI-générée défectueuse, les faisant bannir comme dommages collatéraux. Le système de modération d'arXiv inclut un processus d'appel, mais le fardeau tombe sur l'auteur ciblé pour se défendre, et le tempo lent des appels pendant un ban d'un an c'est exactement le coût que les gamers veulent infliger. Deuxième : la ligne entre « contenu AI-généré inapproprié » et « manuscrit rédigé avec assistance AI et correctement édité » n'est pas tranchante, et l'application consistante sur cette ligne c'est le problème long-tail. La formulation de Dietterich — « contenu AI-produit inapproprié » — accepte implicitement la rédaction AI-assistée qui a été soigneusement éditée et vérifiée par l'auteur. La politique est ciblée sur le slop, pas sur la catégorie d'outil.

Pour les builders qui publient de la recherche AI/ML sur arXiv : la posture pratique n'a pas changé au niveau de surface — générer, éditer, vérifier, citer, soumettre — mais le coût de l'échec vient de monter d'un ordre de magnitude. La bonne discipline c'est de traiter toute prose AI-assistée, surtout les citations et listes de références, comme suspecte par défaut et vérifier avant de soumettre. La communauté arXiv est frustrée depuis deux ans que des papiers AI-générés passaient au peer-review ; cette politique c'est les premiers crocs d'application concrets de l'intérieur du système. Si le côté institutionnel d'arXiv ratifie le framing décrit par modérateur dans les jours qui viennent c'est la chose à watcher — si le leadership confirme, ça devient le nouveau plancher ; si le leadership adoucit, ça devient un événement de discrétion-modérateur. Quoi qu'il en soit, le signal aux auteurs aujourd'hui c'est clair.