Thomas Dietterich — professor emérito em Oregon State, no conselho consultivo editorial do arXiv e em sua equipe de moderação — postou no X e Bluesky descrevendo uma nova política de aplicação: manuscritos encontrados contendo conteúdo gerado por AI inapropriado resultarão em um banimento de envio de um ano para cada autor listado, mais um requisito permanente de que qualquer manuscrito futuro passe peer-review formal em uma revista antes do arXiv hospedá-lo. As categorias que Dietterich nomeia são concretas: "linguagem inapropriada, conteúdo plagiado, conteúdo enviesado, erros, equívocos, referências incorretas ou conteúdo enganoso". Todos os autores de um manuscrito são responsáveis por seu conteúdo sob esse enquadramento — a AI não é a defesa, o autor que pressionou submit é. Caveat honesto no topo: isto é descrito por moderador, ainda não confirmado pela liderança do arXiv. A Ars Technica buscou confirmação e ainda não recebeu resposta no momento da escrita.

A razão pela qual isto aterrissa mais forte que uma atualização de política normal é o papel que o arXiv desempenha em física, astronomia e pesquisa de machine-learning. Nesses campos o preprint é parte do processo normal de publicação — pesquisadores postam no arXiv, coletam feedback peer informal por semanas ou meses, depois iteram em direção a uma submissão formal a revista. Um banimento de envio de um ano remove esse mecanismo completamente para o autor banido; o requisito permanente peer-review-primeiro remove a forma velocidade-e-feedback da cultura preprint mesmo depois do banimento ser levantado. Sanções severas, em outras palavras, calibradas ao valor que a plataforma provê. O fundamento para a política são os padrões de moderação existentes do arXiv: "envios ao arXiv devem cumprir com padrões apropriados de comunicação acadêmica em forma... escrupulosidade geral e cuidado de preparação são exigidos". O enquadramento de Dietterich é que a nova aplicação são os padrões de moderação aplicados consistentemente, não uma nova regra de conteúdo.

Dois modos de falha valem ser sinalizados. Primeiro: o sistema pode ser manipulado listando autores inocentes em um envio AI-gerado falho, fazendo-os ser banidos como dano colateral. O sistema de moderação do arXiv inclui um processo de apelação, mas o ônus cai sobre o autor alvo para se defender, e o tempo lento das apelações durante um banimento de um ano é exatamente o custo que os manipuladores querem infligir. Segundo: a linha entre "conteúdo AI-gerado inapropriado" e "manuscrito redigido com assistência AI e editado apropriadamente" não é brilhante, e a aplicação consistente nessa linha é o problema de cauda longa. A redação de Dietterich — "conteúdo AI-produzido inapropriado" — implicitamente aceita redação AI-assistida que foi cuidadosamente editada e verificada pelo autor. A política é direcionada ao slop, não à categoria de ferramenta.

Para builders publicando pesquisa AI/ML no arXiv: a postura prática não mudou no nível de superfície — gerar, editar, verificar, citar, enviar — mas o custo da falha acabou de subir em uma ordem de magnitude. A disciplina correta é tratar qualquer prosa AI-assistida, especialmente citações e listas de referências, como suspeita por padrão e verificar antes de enviar. A comunidade arXiv tem estado frustrada por dois anos com papers AI-gerados passando para peer-review; esta política são os primeiros dentes de aplicação concretos de dentro do sistema. Se o lado institucional do arXiv ratificar o enquadramento descrito por moderador nos próximos dias é a coisa a observar — se a liderança confirmar, isto se torna o novo piso; se a liderança suavizar, se torna um evento de discrição-moderador. De qualquer forma, o sinal aos autores hoje é claro.