Zubnet AI学习Wiki › 指令遵循
使用AI

指令遵循

别名:指令服从
模型准确执行用户要求的能力——遵守格式约束、长度要求、风格规范和行为指令。“用法语写恰好 3 个关于 X 的要点”测试的是指令遵循:回复必须是要点(而非段落)、恰好 3 个(而非 2 或 5)、用法语(而非英语),且关于 X(而非 Y)。

为什么重要

指令遵循是最具实际重要性的 LLM 能力。用户更关心的不是模型是否“知道”更多事实,而是它是否按照他们实际要求的去做。一个写出优美散文但忽略格式要求的模型,不如一个能可靠遵循指令的模型有用。这就是为什么 IFEval 和其他指令遵循基准测试已成为模型评估的核心。

深度解析

指令遵循通过指令微调(在指令-回复对上的 SFT)进行训练,并通过 RLHF/DPO(学习偏好准确遵循指令的回复)进行优化。指令遵循的质量在很大程度上取决于训练数据的多样性和精确性:看到很多"恰好 3 项"示例的模型学会了计数;只看到模糊指令的模型则不会。

模型失败之处

常见的指令遵循失败:忽略长度约束("简短回答"→仍然写段落)、格式漂移(以要求的格式开始但转回散文)、约束遗忘(遵循第一个约束但忘记复杂指令中后面的约束),以及过度遵循(过于字面或过于宽泛地解释模糊指令)。这些失败在较小模型中更常见,随着规模增大而变得罕见,但即使是前沿模型偶尔也会遗漏约束。

系统提示和层级

当指令冲突时,指令遵循变得复杂:系统提示说"始终以 JSON 回复",但用户说"给我写首诗"。大多数模型实现了一个指令层级,其中系统级指令优先于用户消息,但边界是模糊的。设计良好的应用会清晰地构建其指令层级,并测试不同级别指令可能冲突的边缘情况。

相关概念

← 所有术语
← 指令微调 损失函数 →
ESC