中国科技员工发布反蒸馏工具，对抗老板推行的 AI 同事流水线

Agent 自动化本该以干净的企业 SaaS 形式出现：CRM 配上 AI 副驾，IDE 配上 AI 结对程序员，没人需要深究到底在建模什么。更混乱的版本已经在中国科技公司内部投入生产，运行载体是 GitHub。MIT Technology Review 这周发了篇关于 Colleague Skill 的报道，作者是上海人工智能实验室的周天嬿。这个工具顾名思义。给它一个同事的名字，它就去抓取你公司的聊天应用，回给你一份 agent 可以回放的工作流手册。

机制很直接。Colleague Skill 从飞书和钉钉（中国企业版的 Slack 和 Teams）拉取聊天记录和文件，把数据送入蒸馏流水线，输出一份描述岗位职责加上「独特习惯」的文档供复制。MITTR 的稿子没说清楚哪个模型驱动了蒸馏环节，周本人也没公开架构细节。被记录下来的是数据底料：工作场所的聊天日志、文件元数据，以及足够编码出人格的行为信号。另外，另一位工程师 Koki Xu 在 4 月 4 日发布了一款反蒸馏工具，带有轻、中、重三档破坏模式，在工作流文档被吸收之前把输入改写成「通用的、不可操作的语言」。这款破坏工具的演示视频拿下超过 500 万点赞。

这是 agent 部署的真实形态，不是 pitch-deck 版本。部署面不是一个干净的 API，也不是打磨得漂漂亮亮的企业功能；它是你的雇主能够触达的任何数据，尤其是绝大多数知识工作真正发生的聊天记录和共享文件。反制动作不是政策，是工程。Xu 的工具本质上是对抗性数据整形，由那些其产出就是训练信号的工人自己执行。如果你在做 agent 工具，这个信号值得注意：你想捕获其知识的人们有 shipping 文化，他们已经在把蒸馏流水线当作需要被扰动的敌对输入。

两点供咀嚼。第一，聊天 app 抓取才是真正的训练底料——飞书、钉钉、Slack、Teams、Notion 是信号所在，而依赖干净手写 SOP 的 agent 工具正在错过真实的数据分布。第二，破坏模式会泛化开来。一旦轻/中/重档的对抗性工作流改写模式流行起来，你就会看到它被部署到每一个输入为用户可见工作场所内容的「你的 AI 同事」工具上。如果你的 agent 流水线把蒸馏输入当成可信的，请为它不可信做好准备。

中国科技员工发布反蒸馏工具，对抗老板推行的 AI 同事流水线

更多新闻