Meta está apostando numa decisão recente da Suprema Corte sobre responsabilidade de ISP em pirataria para escapar de processos de direitos autorais sobre sua coleta de dados de treinamento de IA. A empresa apresentou uma declaração semana passada argumentando que a decisão da SCOTUS em Cox Communications vai ajudar a derrotar alegações de que cometeu violação contributiva de direitos autorais ao fazer torrenting de aproximadamente 80 terabytes de conteúdo pirata. O processo da Entrepreneur Media alega que Meta conscientemente facilitou a violação ao alimentar torrents—uploads que ajudam a acelerar downloads em redes BitTorrent.
Essa jogada legal revela o quão precária é realmente a fundação do treinamento de IA. A estratégia de torrenting da Meta não foi alguma operação clandestina—foi coleta sistemática de dados em escala massiva. A alegação de violação contributiva é particularmente perigosa porque é muito mais fácil de provar que violação direta. Enquanto autores na ação coletiva separada Kadrey v. Meta lutam para mostrar que Meta baixou obras completas (difícil de provar com arquivos torrent fragmentados), violação contributiva só requer provar que Meta facilitou as transferências. Um juiz já decidiu que essa alegação pode prosseguir.
A defesa da Meta depende da conclusão da Suprema Corte de que empresas não são responsáveis por "meramente fornecer um serviço" com conhecimento de violação, a menos que tenham "afirmativamente induzido" isso. Mas isso parece forçado—Meta não estava apenas fornecendo infraestrutura como um ISP. Eles estavam ativamente alimentando torrents para colher dados de treinamento. A distinção entre facilitar pirataria e participar dela pode não se sustentar quando você é quem está fazendo a alimentação.
Para desenvolvedores de IA, este caso importa além dos problemas legais da Meta. Se tribunais decidirem que fazer torrenting de obras protegidas por direitos autorais para treinamento constitui violação contributiva, isso poderia remodelar como empresas obtêm dados. Os dias de "mova rápido e colete tudo" podem estar acabando, forçando uma mudança para conjuntos de dados licenciados ou geração de dados sintéticos.
