消息人士向WIRED确认,Meta已无限期暂停与数据承包公司Mercor的所有合作,此前发生的安全漏洞可能暴露了专有的AI训练数据集。Mercor在3月31日向员工披露的这起事件,似乎与针对LiteLLM的供应链攻击有关,该攻击危及了"全球数千家组织"。OpenAI正在调查数据暴露范围,但继续进行与Mercor的现有项目,而其他主要AI实验室正在重新评估与该供应商的关系。
此次泄露突显了AI开发中的关键漏洞:外包数据生成管道。Mercor与Scale AI和Surge等竞争对手一起,管理着庞大的人工承包商网络,这些承包商创建定制训练数据集,为ChatGPT和Claude等模型提供动力。这些数据集被视为核心知识产权——它们准确揭示了AI实验室如何处理训练、优先考虑什么数据,以及潜在的竞争优势。围绕这些操作的保密性创造了一个影子行业,少数几家供应商掌握着整个AI生态系统训练方法的钥匙。
对于一个已经对中国竞争对手和国家赞助的知识产权盗窃感到偏执的行业来说,时机再糟不过了。Meta的立即暂停——在项目进行中就切断承包商付款——表明潜在暴露超出了常规安全事件的范围。从事Meta Chordus项目(教AI使用多个互联网来源验证回应)的承包商突然被告知项目正在"重新评估",这一事实表明此次泄露可能揭露了Meta认为具有战略敏感性的特定训练方法。
对开发者而言,这起事件暴露了AI训练供应链已变得多么集中和脆弱。如果你正在构建AI产品,请考虑你的竞争护城河有多少依赖于实际由第三方供应商控制的训练数据,而这些供应商可能没有企业级安全保障。围绕少数几家数据提供商的整合创造了系统性风险,而行业在很大程度上忽视了这一点。
