AI training labor: CWA की रिपोर्ट — 22% data workers ने बेघरी झेली, Zubnet AI समाचार

AI श्रम पत्रकार Karen Hao का mini-documentary, जो इस सप्ताह non-profit More Perfect Union के माध्यम से प्रकाशित हुआ, Communication Workers of America की 2025 की research सामने लाया जिसने दिखाया कि AI systems train करने वाले 22% workers ने अपनी कम मज़दूरी के कारण बेघरी झेली है। labor researcher Tim Newman की एक समानांतर study bill-pressure की संख्या 86% पर रखती है — यानी Newman ने जिन data workers का सर्वे किया उनमें से 86% ने पिछले साल bills चुकाने में संघर्ष किया, और लगभग एक-चौथाई SNAP या Medicaid जैसी public assistance पर निर्भर थे। documentary का नामित केंद्र Mercor है, San Francisco-based online marketplace, जो contractors को OpenAI सहित AI buyers से जोड़ता है। Mercor लगभग 30,000 की workforce report करती है। Hao जिस recurring pattern को document करती हैं वह है — हाल ही में विस्थापित white-collar workers की भर्ती ताकि वे AI systems को अपना पुराना काम सिखाएँ — एक interviewee, "Jen", food stamps पर एक Ivy League PhD, ने Mercor की $55/घंटे "philosophy intelligence analyst" वाली gig ली, बस यह देखने के लिए कि दो हफ़्ते बाद उसका contract group message से समाप्त कर दिया गया।

stats को उचित framing चाहिए। CWA एक labor union है जिसकी policy position है; 22% बेघरी का figure AI-training workers का सर्वे करने वाली union research से है, BLS या स्वतंत्र census से नहीं, और lede sample size या methodology का खुलासा नहीं करता। Newman का 86%-bills-से-जूझ रहे figure भी similarly self-reported survey data है, बिना comparison cohort के। फिर भी, Hao एक भरोसेमंद AI labor reporter हैं (पहले MIT Technology Review में), Sama, Scale AI और African data-labeling pipeline पर उनका पिछला काम fact-check पर टिका है; More Perfect Union एक स्थापित labor-focused non-profit है। Mercor का pattern — gig pay, अचानक contract termination, अपारदर्शी task description, AI-buyer non-disclosure — 2026 की शुरुआत में Wired (Ruth Fowler के Hollywood-screenwriters वाले टुकड़े) और Meta के Ireland में data labeling की चल रही coverage से मेल खाता है। directional signal वहाँ भी टिकता है जहाँ individual statistics को verification चाहिए।

ecosystem read उन धागों को जोड़ती है जो अलग-अलग समानांतर चल रहे थे। आज पहले की Anthropic-ने-OpenAI-को-पीछे-छोड़ा वाली piece दिखाती थी कि lab market sticky distribution वाले दो enterprise frontrunners में consolidate हो रहा है; यह Hao का documentary उस data-labor floor को दिखाता है जिस पर ये models train होते हैं। दोनों सच हैं: AI lab tier में consolidate हो रहा है और labor tier में bifurcate हो रहा है — frontier labs में top-of-market engineering salaries, और data-labeling tier पर gig-wage precarity जो RLHF, preference data, और capability-specific fine-tuning sets देता है। "AI सस्ती labor पर बना है" यह narrative 2022 के Kenyan data workers से recurring है जो Sama-contracted GPT moderation training पर रिपोर्ट कर रहे थे; 2026 में नया रूप यह है कि सस्ती labor अब US के Ivy PhDs भी हैं, सिर्फ़ विदेश में outsource किए हुए labelers नहीं। इसका policy implication है जिसकी builders को अपेक्षा करनी चाहिए: state-level legislative interest, संभावित CWA organizing campaigns, और data vendors पर procurement scrutiny।

builders के लिए: अगर तुम Mercor, Scale, Surge, या Invisible के माध्यम से data labeling या preference data ख़रीदते हो, labor-practice का सवाल अब procurement diligence के लिए load-bearing है — abstract ESG concern नहीं। तीन concrete चीज़ें करनी हैं: (1) sign करने से पहले vendor से documented per-worker compensation floors और contract-stability commitments माँगो; (2) vendor selection में reputational risk factor करो — इन कंपनियों में से कम से कम एक अगले 12 महीनों में high-profile labor story का सामना करेगी; (3) उम्मीद करो कि labor-practice disclosure standard data-vendor compliance package का हिस्सा बनेगा, जैसे SOC 2 cloud vendors के लिए standard बना। CWA की stat में caveats हो सकते हैं, पर underlying pattern असली है, और policy attention compound करेगी। Hao का documentary More Perfect Union पर है; यह primary source है जिसे secondary coverage narrative shape करने से पहले देखना चाहिए।

AI training labor: CWA की रिपोर्ट — 22% data workers ने बेघरी झेली

और समाचार