Microsoft Harrier 模型抛弃 BERT，转向纯解码器嵌入架构

Microsoft 发布了 Harrier-OSS-v1，三个开源多语言嵌入模型，打破了多年来 BERT 主导的嵌入架构。该系列涵盖 270M、600M 和 27B 参数，在 Multilingual MTEB v2 基准测试中均达到最先进结果。与传统双向编码器不同，这些模型使用纯解码器架构配合最后token池化——与 ChatGPT 和其他现代 LLMs 相同的因果注意力模式。

这种架构转变的意义超出基准数字所暗示的。大多数嵌入模型最多处理 512-1024 个token，迫使开发者进行激进的文档分块，破坏语义连贯性。Harrier 的 32k 上下文窗口改变了 RAG 系统的游戏规则——你可以嵌入整篇研究论文、长代码文件或全面文档，而不会在分块边界丢失语义。转向纯解码器也使这些模型能够受益于驱动 LLM 改进的相同缩放定律和训练技术。

Microsoft 的公告没有说明为什么选择这种特定的池化策略，而不是均值池化或注意力加权方法等替代方案。指令调优设计也增加了操作复杂性——查询需要任务特定前缀而文档不需要，创建了不对称编码模式，可能会困扰习惯对称嵌入工作流程的开发者。

对于构建者而言，这次发布预示了嵌入技术的发展方向：更长的上下文、LLM 风格架构和更细致的指令遵循。270M 模型为大多数用例提供了生产就绪选项，而 27B 版本针对嵌入质量优先于推理速度的应用。记住指令格式要求——跳过这些前缀会严重影响你的检索性能。

Microsoft Harrier 模型抛弃 BERT，转向纯解码器嵌入架构

更多新闻