El principio clave: los aumentos deben preservar la etiqueta. Voltear horizontalmente la imagen de un gato sigue mostrando un gato (aumento válido). Voltear una señal de "gira a la izquierda" la convierte en "gira a la derecha" (aumento inválido). Elegir aumentos apropiados requiere entender qué invariancias importan para tu tarea.
AutoAugment y sus sucesores (RandAugment, TrivialAugment) aprenden o aleatorizan políticas de aumento en lugar de diseñarlas a mano. Cutout/CutMix enmascaran o mezclan aleatoriamente parches de diferentes imágenes. MixUp interpola entre pares de ejemplos, creando puntos de entrenamiento sintéticos que suavizan las fronteras de decisión. Estas técnicas son ahora estándar en las pipelines de entrenamiento de visión.
Con modelos generativos, el aumento va más allá de las transformaciones geométricas. Puedes usar LLMs para parafrasear datos de entrenamiento de texto, usar modelos de difusión para generar imágenes variantes, o usar modelos para crear ejemplos de entrenamiento completamente nuevos (datos sintéticos). La línea entre "aumento" (modificar ejemplos existentes) y "datos sintéticos" (generar nuevos ejemplos) se está difuminando, y ambos se están volviendo partes esenciales de las pipelines modernas de entrenamiento.