मानक संघीय शिक्षण एल्गोरिथ्म (FedAvg): (1) सर्वर वर्तमान मॉडल को चयनित प्रतिभागियों को भेजता है, (2) प्रत्येक प्रतिभागी कई चरणों के लिए अपने स्थानीय डेटा पर मॉडल प्रशिक्षित करता है, (3) प्रतिभागी अपने अपडेट किए गए मॉडल भार (डेटा नहीं) सर्वर को भेजते हैं, (4) सर्वर अपडेट का औसत करता है और एक नया वैश्विक मॉडल बनाता है, (5) दोहराएँ। मुख्य गुण: कच्चा डेटा कभी प्रतिभागी के डिवाइस से बाहर नहीं जाता।
Non-IID डेटा: प्रतिभागियों के पास अक्सर बहुत अलग डेटा वितरण होते हैं (टोक्यो के अस्पताल में साओ पाउलो की तुलना में अलग रोगी जनसांख्यिकी है)। इससे प्रशिक्षण अस्थिर हो जाता है — विभिन्न प्रतिभागियों के अपडेट परस्पर विरोधी हो सकते हैं। संचार लागत: मॉडल अपडेट (संभावित रूप से अरबों पैरामीटर) को नेटवर्क पर भेजना महंगा है, विशेषकर मोबाइल उपकरणों के लिए। मुफ़्तखोर: प्रतिभागी जो सुधारा हुआ मॉडल प्राप्त करते हैं लेकिन कम-गुणवत्ता अपडेट योगदान करते हैं। ये चुनौतियाँ संघीय शिक्षण को केंद्रीकृत प्रशिक्षण से कठिन बनाती हैं, हालाँकि प्रत्येक के सक्रिय समाधान हैं।
Apple कीबोर्ड prediction के लिए संघीय शिक्षण का उपयोग करता है (आप जो टाइप करते हैं उससे सीखना बिना आपके टेक्स्ट Apple को भेजे)। Google इसे खोज सुझाव सुधार के लिए उपयोग करता है। हेल्थकेयर कंसोर्टिया इसे बहु-अस्पताल मॉडल प्रशिक्षण के लिए उपयोग करते हैं। तकनीक सबसे मूल्यवान है जब: डेटा वास्तव में संवेदनशील है (चिकित्सा, वित्तीय), विनियमन डेटा साझाकरण को रोकता है (GDPR, HIPAA), या डेटा केंद्रीकृत करने के लिए बहुत बड़ा है (अरबों मोबाइल डिवाइस इंटरैक्शन)।