El algoritmo estándar de aprendizaje federado (FedAvg): (1) el servidor envía el modelo actual a los participantes seleccionados, (2) cada participante entrena el modelo con sus datos locales durante varios pasos, (3) los participantes envían los pesos del modelo actualizado (no los datos) al servidor, (4) el servidor promedia las actualizaciones y crea un nuevo modelo global, (5) repetir. La propiedad clave: los datos sin procesar nunca salen del dispositivo del participante.
Datos no-IID: los participantes a menudo tienen distribuciones de datos muy diferentes (un hospital en Tokio tiene demografías de pacientes diferentes a uno en São Paulo). Esto hace que el entrenamiento sea inestable — las actualizaciones de diferentes participantes pueden entrar en conflicto. Costo de comunicación: enviar actualizaciones del modelo (potencialmente miles de millones de parámetros) por la red es costoso, especialmente para dispositivos móviles. Free-riders: participantes que reciben el modelo mejorado pero contribuyen actualizaciones de baja calidad. Estos desafíos hacen que el aprendizaje federado sea más difícil que el entrenamiento centralizado, aunque cada uno tiene soluciones activas.
Apple usa aprendizaje federado para la predicción del teclado (aprendiendo de lo que escribes sin enviar tus textos a Apple). Google lo usa para mejorar las sugerencias de búsqueda. Los consorcios de salud lo usan para entrenamiento de modelos multi-hospital. La técnica es más valiosa cuando: los datos son verdaderamente sensibles (médicos, financieros), la regulación impide compartir datos (GDPR, HIPAA) o los datos son demasiado grandes para centralizar (miles de millones de interacciones en dispositivos móviles).