Zubnet AIAprenderWiki › Marca de agua
Seguridad

Marca de agua

También conocido como: Marca de agua de IA, AI Watermark
Señales invisibles en contenido generado por IA para su detección. Texto: sesga la selección de tokens estadísticamente. Imagen: patrones de píxeles invisibles.

Por qué importa

Uno de los pocos enfoques para distinguir contenido de IA a escala. Importa para desinformación, integridad académica y procedencia.

En profundidad

Kirchenbauer et al. (2023): el enfoque de lista verde/roja. Antes de generar cada token, el tokenizer divide el vocabulario en tokens "verdes" (favorecidos) y "rojos" (penalizados) basándose en una función del token anterior. El texto resultante tiene una proporción estadísticamente anómala de tokens verdes, detectable pero invisible al lector humano.

Fragilidad

La marca de agua de texto es frágil: parafrasear, traducir o reescribir destruye la señal. Esto limita su utilidad en escenarios adversariales donde alguien quiere ocultar que usó IA. Las marcas de agua en imágenes son más robustas (sobreviven recorte, compresión, ajustes de color) pero no son infalibles.

Regulación e implementación

La Ley de IA de la UE exige etiquetado de contenido generado por IA. Google SynthID y la investigación de Meta son implementaciones en producción. El desafío es equilibrar detectabilidad (para cumplir regulaciones) con calidad (la marca de agua no debe degradar la salida). Las implementaciones actuales logran esto razonablemente bien para texto e imágenes, pero los estándares aún están madurando.

Conceptos relacionados

← Todos los términos
← Mamba MCP →