Meta está apostando a un fallo reciente de la Corte Suprema sobre responsabilidad de ISP en piratería para esquivar demandas por derechos de autor sobre su recolección de datos de entrenamiento de IA. La empresa presentó una declaración la semana pasada argumentando que la decisión de SCOTUS en Cox Communications ayudará a derrotar las acusaciones de que cometió infracción contributoria de derechos de autor al hacer torrenting de aproximadamente 80 terabytes de contenido pirata. La demanda de Entrepreneur Media alega que Meta facilitó conscientemente la infracción al alimentar torrents—subidas que ayudan a acelerar descargas en redes BitTorrent.

Esta jugada legal revela qué tan precarios son realmente los fundamentos del entrenamiento de IA. La estrategia de torrenting de Meta no fue alguna operación pirata—fue recolección sistemática de datos a escala masiva. La acusación de infracción contributoria es particularmente peligrosa porque es mucho más fácil de probar que la infracción directa. Mientras que los autores en la acción de clase separada Kadrey v. Meta luchan por mostrar que Meta descargó obras completas (difícil de probar con archivos torrent fragmentados), la infracción contributoria solo requiere probar que Meta facilitó las transferencias. Un juez ya dictaminó que esta acusación puede proceder.

La defensa de Meta depende del hallazgo de la Corte Suprema de que las empresas no son responsables por "meramente proveer un servicio" con conocimiento de infracción, a menos que la hayan "inducido afirmativamente". Pero esto se siente como un estirón—Meta no solo estaba proporcionando infraestructura como un ISP. Estaban alimentando activamente torrents para cosechar datos de entrenamiento. La distinción entre facilitar piratería y participar en ella podría no sostenerse cuando eres tú quien está haciendo la alimentación.

Para los desarrolladores de IA, este caso importa más allá de los problemas legales de Meta. Si las cortes deciden que hacer torrenting de obras con derechos de autor para entrenamiento constituye infracción contributoria, podría remodelar cómo las empresas obtienen datos. Los días de "muévete rápido y raspa todo" podrían estar terminando, forzando un cambio hacia conjuntos de datos licenciados o generación de datos sintéticos.