Meta mise sur une récente décision de la Cour suprême concernant la responsabilité des fournisseurs d'accès Internet en matière de piratage pour éviter les poursuites pour violation du droit d'auteur liées à sa collecte de données d'entraînement d'IA. L'entreprise a déposé une déclaration la semaine dernière soutenant que la décision de la SCOTUS dans Cox Communications aidera à contrer les allégations qu'elle a commis une violation contributive du droit d'auteur en téléchargeant par torrent environ 80 téraoctets de contenu piraté. La poursuite d'Entrepreneur Media allègue que Meta a sciemment facilité la violation en alimentant des torrents—des téléversements qui aident à accélérer les téléchargements dans les réseaux BitTorrent.
Cette manœuvre juridique révèle à quel point les fondations de l'entraînement d'IA sont précaires. La stratégie de torrenting de Meta n'était pas une opération clandestine—c'était de la collecte systématique de données à grande échelle. L'allégation de violation contributive est particulièrement dangereuse parce qu'elle est beaucoup plus facile à prouver que la violation directe. Alors que les auteurs dans l'action collective séparée Kadrey c. Meta peinent à démontrer que Meta a téléchargé des œuvres complètes (difficile à prouver avec des fichiers torrent fragmentés), la violation contributive nécessite seulement de prouver que Meta a facilité les transferts. Un juge a déjà statué que cette réclamation peut procéder.
La défense de Meta repose sur la conclusion de la Cour suprême que les entreprises ne sont pas responsables de « simplement fournir un service » en connaissance de cause de violation, à moins qu'elles ne l'aient « positivement incitée ». Mais ça semble tiré par les cheveux—Meta ne fournissait pas juste de l'infrastructure comme un fournisseur d'accès. Ils alimentaient activement des torrents pour récolter des données d'entraînement. La distinction entre faciliter le piratage et y participer pourrait ne pas tenir quand c'est vous qui faites l'alimentation.
Pour les développeurs d'IA, cette affaire importe au-delà des problèmes juridiques de Meta. Si les tribunaux décident que télécharger par torrent des œuvres protégées pour l'entraînement constitue une violation contributive, ça pourrait redéfinir comment les entreprises s'approvisionnent en données. Les jours du « bouge vite et gratte tout » tirent peut-être à leur fin, forçant un virage vers des ensembles de données sous licence ou la génération de données synthétiques.
