O algoritmo padrão de aprendizado federado (FedAvg): (1) o servidor envia o modelo atual para participantes selecionados, (2) cada participante treina o modelo em seus dados locais por vários passos, (3) participantes enviam seus pesos de modelo atualizados (não dados) para o servidor, (4) o servidor faz a média das atualizações e cria um novo modelo global, (5) repetir. A propriedade-chave: dados brutos nunca saem do dispositivo do participante.
Dados não-IID: participantes frequentemente têm distribuições de dados muito diferentes (um hospital em Tóquio tem demografia de pacientes diferente de um em São Paulo). Isso torna o treinamento instável — atualizações de diferentes participantes podem conflitar. Custo de comunicação: enviar atualizações de modelo (potencialmente bilhões de parâmetros) pela rede é caro, especialmente para dispositivos móveis. Free-riders: participantes que recebem o modelo melhorado mas contribuem atualizações de baixa qualidade. Esses desafios tornam o aprendizado federado mais difícil que o treinamento centralizado, embora cada um tenha soluções ativas.
A Apple usa aprendizado federado para predição de teclado (aprendendo com o que você digita sem enviar seus textos para a Apple). O Google usa para melhoria de sugestões de busca. Consórcios de saúde usam para treinamento de modelos multi-hospital. A técnica é mais valiosa quando: os dados são verdadeiramente sensíveis (médicos, financeiros), a regulamentação impede compartilhamento de dados (LGPD, GDPR, HIPAA) ou os dados são grandes demais para centralizar (bilhões de interações em dispositivos móveis).