संघीय शिक्षण (Federated Learning): परिभाषा और अर्थ — AI विकी

एक प्रशिक्षण दृष्टिकोण जहाँ मॉडल को कच्चे डेटा को साझा किए बिना कई उपकरणों या संगठनों में प्रशिक्षित किया जाता है। डेटा को केंद्रीय सर्वर पर भेजने के बजाय, प्रत्येक प्रतिभागी अपने स्वयं के डेटा पर मॉडल की एक स्थानीय कॉपी प्रशिक्षित करता है और केवल मॉडल अपडेट (ग्रेडिएंट) एक केंद्रीय समन्वयक को भेजता है। समन्वयक सभी प्रतिभागियों से अपडेट एकत्रित करता है ताकि वैश्विक मॉडल में सुधार हो।

यह क्यों मायने रखता है

संघीय शिक्षण ऐसे डेटा पर AI प्रशिक्षण सक्षम बनाता है जिसे गोपनीयता, विनियमन, या प्रतिस्पर्धात्मक चिंताओं के कारण केंद्रीकृत नहीं किया जा सकता। अस्पताल रोगी रिकॉर्ड साझा किए बिना सहयोगात्मक रूप से एक डायग्नोस्टिक मॉडल प्रशिक्षित कर सकते हैं। कंपनियाँ मालिकाना डेटा उजागर किए बिना एक साझा मॉडल में सुधार कर सकती हैं। यह बड़े पैमाने पर गोपनीयता-संरक्षण AI प्रशिक्षण का सबसे व्यावहारिक दृष्टिकोण है।

गहन अध्ययन

मानक संघीय शिक्षण एल्गोरिथ्म (FedAvg): (1) सर्वर वर्तमान मॉडल को चयनित प्रतिभागियों को भेजता है, (2) प्रत्येक प्रतिभागी कई चरणों के लिए अपने स्थानीय डेटा पर मॉडल प्रशिक्षित करता है, (3) प्रतिभागी अपने अपडेट किए गए मॉडल भार (डेटा नहीं) सर्वर को भेजते हैं, (4) सर्वर अपडेट का औसत करता है और एक नया वैश्विक मॉडल बनाता है, (5) दोहराएँ। मुख्य गुण: कच्चा डेटा कभी प्रतिभागी के डिवाइस से बाहर नहीं जाता।

चुनौतियाँ

Non-IID डेटा: प्रतिभागियों के पास अक्सर बहुत अलग डेटा वितरण होते हैं (टोक्यो के अस्पताल में साओ पाउलो की तुलना में अलग रोगी जनसांख्यिकी है)। इससे प्रशिक्षण अस्थिर हो जाता है — विभिन्न प्रतिभागियों के अपडेट परस्पर विरोधी हो सकते हैं। संचार लागत: मॉडल अपडेट (संभावित रूप से अरबों पैरामीटर) को नेटवर्क पर भेजना महंगा है, विशेषकर मोबाइल उपकरणों के लिए। मुफ़्तखोर: प्रतिभागी जो सुधारा हुआ मॉडल प्राप्त करते हैं लेकिन कम-गुणवत्ता अपडेट योगदान करते हैं। ये चुनौतियाँ संघीय शिक्षण को केंद्रीकृत प्रशिक्षण से कठिन बनाती हैं, हालाँकि प्रत्येक के सक्रिय समाधान हैं।

वास्तविक-दुनिया उपयोग

Apple कीबोर्ड prediction के लिए संघीय शिक्षण का उपयोग करता है (आप जो टाइप करते हैं उससे सीखना बिना आपके टेक्स्ट Apple को भेजे)। Google इसे खोज सुझाव सुधार के लिए उपयोग करता है। हेल्थकेयर कंसोर्टिया इसे बहु-अस्पताल मॉडल प्रशिक्षण के लिए उपयोग करते हैं। तकनीक सबसे मूल्यवान है जब: डेटा वास्तव में संवेदनशील है (चिकित्सा, वित्तीय), विनियमन डेटा साझाकरण को रोकता है (GDPR, HIPAA), या डेटा केंद्रीकृत करने के लिए बहुत बड़ा है (अरबों मोबाइल डिवाइस इंटरैक्शन)।

संघीय शिक्षण (Federated Learning)

यह क्यों मायने रखता है

गहन अध्ययन

चुनौतियाँ

वास्तविक-दुनिया उपयोग

संबंधित अवधारणाएँ