AI 训练劳动:CWA 调查显示 22% 的数据工人曾经历无家可归

AI 劳动记者 Karen Hao 本周通过非营利组织 More Perfect Union 发布的一支 mini-纪录片,带出了 Communication Workers of America 2025 年的研究:训练 AI 系统的工人中,有 22% 因为薪水原因经历过无家可归。劳动研究者 Tim Newman 的一份平行研究把"账单压力"这个数字定在 86%——即 Newman 调查的数据工人中有 86% 去年付账单吃力,大约四分之一依赖 SNAP 或 Medicaid 等公共援助。纪录片点名的中心是 Mercor,一家总部在旧金山的在线市场,把外包工人连接到包括 OpenAI 在内的 AI 买家。Mercor 报告的劳动力规模约 3 万。Hao 记录的反复模式是:雇用那些近期被裁的白领,去教 AI 系统怎么做他们原来的工作——其中一位受访者代号"Jen",是个靠食物券生活的常春藤 PhD,接了 Mercor 一个 $55/小时的 gig,职位叫"philosophy intelligence analyst",两周后整组工作以群消息形式终止。

这些统计需要恰当的框架。CWA 是一个工会,有政治立场;22% 无家可归的数字来自工会对 AI 训练工人的研究,不是 BLS 或独立人口统计,lede 没有披露样本大小或方法学。Newman 的 86%-付账单吃力数字同样是自报问卷数据,没有对照群体。话虽如此,Hao 是一位可信的 AI 劳动记者(前 MIT Technology Review),她之前关于 Sama、Scale AI 和非洲数据标注 pipeline 的工作经得起 fact-check;More Perfect Union 是一家成熟的、聚焦劳动议题的非营利。Mercor 的模式——gig 薪、突然终止合同、不透明的任务描述、对 AI 买家不披露——和 2026 年早些时候 Wired(Ruth Fowler 那篇好莱坞编剧的报道)以及对 Meta 爱尔兰数据标注裁员的持续报道相吻合。哪怕个别统计数据需要核实,方向性信号是站得住的。

生态读法把几条原本平行但没有连起来的线串起来。今天早些时候那篇 Anthropic 反超 OpenAI 显示实验室市场正在合并成两家具有黏性分销的企业前锋;这部 Hao 的纪录片显示了这些模型训练所依赖的 data-labor 地板。两者同时为真:AI 在 lab 层合并,在劳动层分叉——前沿实验室的工程师拿市场顶薪,数据标注端则是供给 RLHF、偏好数据、能力专属 fine-tuning 集的 gig 薪不稳定层。"AI 建立在廉价劳动力之上"这条叙事自 2022 年肯尼亚数据工人讲述他们如何为 Sama 合同下的 GPT 内容审核做训练以来一直存在;2026 年的新形态是:廉价劳动力现在也包括美国本土的常春藤 PhD,不再只是外包到国外的 labeler。这会带来 builder 应当预期的政策后果:州一级立法关注、可能的 CWA 组织运动、以及对数据 vendor 的采购审查。

对 builder:如果你通过 Mercor、Scale、Surge、Invisible 等买数据标注或偏好数据,劳动实践这件事现在对采购尽职调查是承重的——不再是抽象的 ESG 顾虑。三件可落地的事:(1) 在签约前,要求 vendor 提供有文档支撑的每工人薪酬底线和合同稳定性承诺;(2) 把声誉风险纳入 vendor 选择——这些公司里至少有一家会在未来 12 个月里面临一个高曝光度的劳动事件;(3) 预期劳动实践披露将成为数据 vendor 合规标准包的一部分,就像 SOC 2 成为云 vendor 的标准。CWA 数据可能有 caveat,但底下的模式是真的,政治关注会复利。Hao 的纪录片在 More Perfect Union 上;这是值得在二次报道塑形之前看的一手来源。

AI 训练劳动:CWA 调查显示 22% 的数据工人曾经历无家可归

更多新闻