Il existe une infrastructure de takedown fonctionnelle pour le contenu adulte piraté — et elle ne capte pas ce qui remplace le piratage. MIT Technology Review rapporte que Takedown Piracy a empreinté plus de 500 millions de vidéos et tiré environ 130 millions des résultats Google seuls. Ce pipeline marche sur le match d'empreintes contre des sources connues. Les copies modifiées par IA des mêmes performeurs — petites éditions qui effacent une tache de naissance ou décalent les proportions — glissent à côté du fingerprinting parce que le nouveau fichier ne matche plus l'original. L'infrastructure en place est celle d'un problème qui rétrécit.
La classe de contenu n'est pas le face-swap deepfake — c'est corporel. Le corps même des performeurs sert de données d'entraînement, puis est regénéré avec des altérations mineures. Des chercheurs cités dans l'article estiment que plus de 10 000 téraoctets de contenu adulte en ligne sont probablement dans les corpus d'entraînement IA actuels, mais ils signalent cette estimation comme une « hypothèse raisonnable » plutôt qu'une mesure (aucun lab majeur ne publie d'audits de filtrage de corpus à ce niveau de granularité). Les outils nommés incluent les apps « nudify » Crushmate et Grok, et l'app de sexting Mynx, où des arnaqueurs ont déployé des deepfakes IA de performeurs nommés pour escroquer des utilisateurs payants. Spicey AI — maintenant disparue — a tenté de formaliser le problème dans l'autre sens : des contrats où les performeurs cédaient la propriété de leurs ressemblances IA.
La couche légale se forme mais reste inégale. Le Take It Down Act fédéral criminalise la publication d'imagerie intime non-consensuelle, ce qui est des dents qui n'existaient pas avant. Les avocats de performeurs cités signalent le risque dual-use : le même statut peut être instrumentalisé contre du contenu de performance consensuel sous un faux avis de takedown. Les chaînes DMCA s'effondrent complètement quand les hôtes opèrent depuis la Russie, les Seychelles ou les Pays-Bas. Pour les plateformes d'image- et de vidéo-génération qui shippent aujourd'hui, ça compte à deux niveaux : les corpus de pré-entraînement contiennent presque certainement du contenu adulte scrapé sauf si un passage de filtrage délibéré a été fait (et peu de labs en documentent un), et le problème de détection en aval — identifier qu'une sortie générée est un body-deepfake d'une personne réelle — n'est pas résolu par l'outillage de fingerprinting existant.
Si tu shippes de la génération d'image ou de vidéo, l'implication pratique c'est que tu ne peux pas t'appuyer sur l'écosystème de takedown existant pour capter les outputs dérivés de ton modèle. La recherche sur les « embodied harms » citée dans l'article distingue la dysmorphie corporelle et l'auto-censure comme effets séparés de la classe de trauma du face-deepfake — mécanisme différent, mitigation différente. Le cadre légal continuera de bouger ; l'écart de détection technique ne se fermera pas tout seul.
