Zubnet AIAprenderWiki › Aprendizaje federado
Entrenamiento

Aprendizaje federado

También conocido como: FL, Aprendizaje colaborativo
Un enfoque de entrenamiento donde el modelo se entrena a través de múltiples dispositivos u organizaciones sin compartir los datos sin procesar. En lugar de enviar datos a un servidor central, cada participante entrena una copia local del modelo con sus propios datos y envía solo las actualizaciones del modelo (gradientes) a un coordinador central. El coordinador agrega las actualizaciones de todos los participantes para mejorar el modelo global.

Por qué importa

El aprendizaje federado permite el entrenamiento de IA con datos que no pueden centralizarse debido a la privacidad, la regulación o preocupaciones competitivas. Los hospitales pueden entrenar colaborativamente un modelo de diagnóstico sin compartir registros de pacientes. Las empresas pueden mejorar un modelo compartido sin exponer datos propietarios. Es el enfoque más práctico para el entrenamiento de IA que preserva la privacidad a escala.

En profundidad

El algoritmo estándar de aprendizaje federado (FedAvg): (1) el servidor envía el modelo actual a los participantes seleccionados, (2) cada participante entrena el modelo con sus datos locales durante varios pasos, (3) los participantes envían los pesos del modelo actualizado (no los datos) al servidor, (4) el servidor promedia las actualizaciones y crea un nuevo modelo global, (5) repetir. La propiedad clave: los datos sin procesar nunca salen del dispositivo del participante.

Desafíos

Datos no-IID: los participantes a menudo tienen distribuciones de datos muy diferentes (un hospital en Tokio tiene demografías de pacientes diferentes a uno en São Paulo). Esto hace que el entrenamiento sea inestable — las actualizaciones de diferentes participantes pueden entrar en conflicto. Costo de comunicación: enviar actualizaciones del modelo (potencialmente miles de millones de parámetros) por la red es costoso, especialmente para dispositivos móviles. Free-riders: participantes que reciben el modelo mejorado pero contribuyen actualizaciones de baja calidad. Estos desafíos hacen que el aprendizaje federado sea más difícil que el entrenamiento centralizado, aunque cada uno tiene soluciones activas.

Uso en el mundo real

Apple usa aprendizaje federado para la predicción del teclado (aprendiendo de lo que escribes sin enviar tus textos a Apple). Google lo usa para mejorar las sugerencias de búsqueda. Los consorcios de salud lo usan para entrenamiento de modelos multi-hospital. La técnica es más valiosa cuando: los datos son verdaderamente sensibles (médicos, financieros), la regulación impide compartir datos (GDPR, HIPAA) o los datos son demasiado grandes para centralizar (miles de millones de interacciones en dispositivos móviles).

Conceptos relacionados

ESC