白宫科技政策办公室(OSTP)周四发布备忘录,指控总部位于中国的实体开展工业规模的活动,以窃取美国前沿AI模型的能力。主任Michael Kratsios将蒸馏点名为主要技术,声称使用数万个代理账户和越狱提示从美国实验室提取专有输出。中国驻华盛顿大使馆称这些指控毫无根据且为诽谤,重申对知识产权保护的承诺,并反对其所称的对中国企业的无理打压。时机很重要:该备忘录发布时,距离重新安排至5月14日的特朗普-习近平峰会仅有三周。
蒸馏并不新奇。你在大教师模型生成的输出上训练小学生模型,对齐logits或响应分布。做得好的话,学生能用一小部分参数捕获教师的相当一部分能力。使其具争议性的是API条款。OpenAI和Anthropic都禁止使用输出训练竞争模型,且越狱提示被明确禁止。这里有两项指控纠缠在一起。一项是合同层面:DeepSeek、Moonshot AI和MiniMax等公司据称通过用抓取的输出训练违反了服务条款。另一项是操作层面:使用数千个代理账户和越狱提示规避速率限制和安全过滤。
周四的变化在于,一场服务条款争议变成了国家安全定性。Kratsios的备忘录将通常通过API封禁、速率限制和民事诉讼处理的合同执行,转化为主权知识产权问题。这会引来出口管制、实体清单添加以及芯片限制已经产生的那种双边升级。备忘录的模糊性是其特点:工业规模没有指明具体金额或具体事件,但确立了外交姿态。Anthropic和OpenAI公开提出蒸馏担忧已有数月;本备忘录在行政层面追认了这些担忧。
如果你正在使用API前沿模型的输出来训练模型,你的法律风险刚刚成倍增加。过去是服务条款违规,虽糟糕但有限;现在被定性为与国家安全相关的知识产权盗窃。即使是中国以外的builders也要在意。以前把GPT或Claude的合成数据混入训练管线带有合同风险;现在它带有政治风险,尤其是如果你分发所得模型。诚实的路径很清楚:如果你无法解释每个训练信号的来源以及哪些服务条款管辖它,你就有一个不会安静下来的供应链问题。
