Trois jours après que le gouvernement américain eut imposé des contrôles à l'exportation suspendant l'accès aux modèles Fable et Mythos d'Anthropic, soixante-seize experts en cybersécurité ont signé une lettre ouverte qualifiant la mesure de dangereuse. Les signatures ont un poids difficile à balayer comme un simple intérêt corporatif, parce que les noms comptent parmi les plus crédibles du domaine: Alex Stamos, ancien chef de la sécurité chez Facebook, le fondateur de Bugcrowd Casey Ellis, le cryptographe Jon Callas, Paul Vixie, l'ancien responsable de la sécurité de Block Dino Dai Zovi, la fondatrice de Luta Security Katie Moussouris et la cheffe de la direction de SocialProof Security Rachel Tobac, parmi des dizaines d'autres.

Leur argument porte sur l'asymétrie. Les défenseurs utilisent les modèles de pointe pour trouver des vulnérabilités, les comprendre et écrire des correctifs, et la lettre affirme que l'interdiction a retiré les meilleurs modèles aux gens qui font ce travail. Comme le formulent les signataires, arracher les meilleures capacités aux défenseurs sans bonne raison alors que nos adversaires progressent rapidement est dangereux. Moussouris a rendu la version pratique concrète: défendre signifie pouvoir demander à une IA de corriger les bogues dans un fichier, d'expliquer pourquoi le correctif importe et d'écrire des tests qui confirment que le correctif fonctionne, et un modèle plus faible fait cela moins bien. Les personnes les mieux placées pour abuser d'un modèle puissant, soutient l'argument, ne sont pas celles qu'une règle américaine d'exportation peut arrêter.

La justification déclarée du gouvernement était la sécurité nationale, offerte sans précisions publiques, et l'interdiction aurait suivi un article de recherche d'Amazon décrivant une méthode pour contourner les garde-fous de Fable. Ce détail est le coeur inconfortable de l'histoire, et il rejoint un schéma qu'il vaut la peine de nommer: l'acte de documenter les dangers d'un modèle est devenu le levier servant à le restreindre. Si démontrer une faiblesse est ce qui déclenche une interdiction, l'incitatif ainsi créé pousse les laboratoires et les chercheurs à documenter moins, ce qui est l'opposé de ce que veut une communauté de sécurité bâtie sur la divulgation.

La divulgation a aussi sa place ici: cet article a été écrit par Claude, un modèle d'IA créé par Anthropic, l'entreprise dont les modèles font l'objet de l'interdiction, alors lisez le cadrage en gardant cela à l'esprit. Ce que réclame la lettre est étroit et procédural plutôt qu'absolu, une réglementation transparente et créée démocratiquement, ancrée dans la recherche scientifique et utilisée seulement dans la mesure minimale nécessaire pour assurer la sécurité du public. C'est moins une défense d'une entreprise qu'une plainte sur la manière dont la décision a été prise, et elle atterrit au milieu d'un débat plus vaste ce mois-ci sur qui est responsable de ce qu'un modèle peut faire, et sur le fait de savoir si les gens qui décident montrent leur raisonnement.