智能体AI在演示中和智能体AI在生产中之间的差距,开始在数字中显现出来。在Confluent发布的年度Data Streaming Report中,一项覆盖14个国家、4,625名IT负责人的调查显示,在已将智能体AI投入生产的受访者中,77%表示项目因数据相关问题而陷入停滞,61%称项目被彻底放弃。采用是真实的,而且仍在增长,但停滞率同样在上升。

IT负责人列出的障碍大多与模型无关。技能缺口和组织准备不足以69%高居榜首,紧随其后的是对LLM可靠性和非确定性的担忧,占68%,数据基础设施和质量占66%,治理、风险与合规占65%。一到五个月的延误十分常见,有些项目则无限期停摆。如今约32%的企业已将智能体AI投入生产,高于一年前的29%,因此这更像是采用进程中痛苦的前沿,而非其崩溃。

底层反复出现的主题是数据,而且这不只是质量层面的抱怨。自主智能体会基于给它的任何数据采取行动,这就把不可靠的来源和陈旧的信息变成了一个安全问题,而非一项报表层面的不便:智能体会基于无人核实过的数据采取真实的行动。这与本周在别处浮现的信任缺口如出一辙,从Google为智能体核实其所连接工具而推出的新标准,到一项最优模型仍只能完成约三分之一专家级科学任务的基准测试。

这一发现与更广泛的研究氛围相吻合。Gartner曾预测,到2027年将有超过40%的智能体AI项目被取消,而Transcend的另一项调查把因数据权限和治理缺口而推迟、收缩或放弃AI的企业比例定在81%。这一切并不是说智能体不起作用,而是说困难之处不在演示,而在于把一个自主系统接入杂乱的真实数据和真实的问责机制,而眼下能力的到来速度,始终快于安全运行所需的管道与信任。