Aprendizado Federado: Definição e significado — Wiki de IA

Uma abordagem de treinamento onde o modelo é treinado em múltiplos dispositivos ou organizações sem compartilhar os dados brutos. Em vez de enviar dados para um servidor central, cada participante treina uma cópia local do modelo em seus próprios dados e envia apenas as atualizações do modelo (gradientes) para um coordenador central. O coordenador agrega as atualizações de todos os participantes para melhorar o modelo global.

Por que isso importa

O aprendizado federado permite treinamento de IA em dados que não podem ser centralizados devido a privacidade, regulamentação ou preocupações competitivas. Hospitais podem treinar colaborativamente um modelo diagnóstico sem compartilhar prontuários de pacientes. Empresas podem melhorar um modelo compartilhado sem expor dados proprietários. É a abordagem mais prática para treinamento de IA com preservação de privacidade em escala.

Em profundidade

O algoritmo padrão de aprendizado federado (FedAvg): (1) o servidor envia o modelo atual para participantes selecionados, (2) cada participante treina o modelo em seus dados locais por vários passos, (3) participantes enviam seus pesos de modelo atualizados (não dados) para o servidor, (4) o servidor faz a média das atualizações e cria um novo modelo global, (5) repetir. A propriedade-chave: dados brutos nunca saem do dispositivo do participante.

Desafios

Dados não-IID: participantes frequentemente têm distribuições de dados muito diferentes (um hospital em Tóquio tem demografia de pacientes diferente de um em São Paulo). Isso torna o treinamento instável — atualizações de diferentes participantes podem conflitar. Custo de comunicação: enviar atualizações de modelo (potencialmente bilhões de parâmetros) pela rede é caro, especialmente para dispositivos móveis. Free-riders: participantes que recebem o modelo melhorado mas contribuem atualizações de baixa qualidade. Esses desafios tornam o aprendizado federado mais difícil que o treinamento centralizado, embora cada um tenha soluções ativas.

Uso no Mundo Real

A Apple usa aprendizado federado para predição de teclado (aprendendo com o que você digita sem enviar seus textos para a Apple). O Google usa para melhoria de sugestões de busca. Consórcios de saúde usam para treinamento de modelos multi-hospital. A técnica é mais valiosa quando: os dados são verdadeiramente sensíveis (médicos, financeiros), a regulamentação impede compartilhamento de dados (LGPD, GDPR, HIPAA) ou os dados são grandes demais para centralizar (bilhões de interações em dispositivos móveis).

Aprendizado Federado

Por que isso importa

Em profundidade

Desafios

Uso no Mundo Real

Conceitos relacionados