Google 在 Nature 发表了一项研究,显示其医疗 AI 系统 AMIE 不仅能做诊断:它还能帮助长期管理病情。在一项针对 21 名初级保健医生、覆盖 100 个多次就诊情景的随机盲法对照中,AMIE 在整体管理推理上与医生相当甚至更优,并在方案精确度和与临床指南的符合度上得分高于医生。最关键的限定条件就紧挨着这一结果:这些患者是经过训练的演员,而非真实病人。
AMIE 是 Articulate Medical Intelligence Explorer 的缩写,最初是一套用于诊断的对话系统,早期工作聚焦于弄清病因这一次性的诊疗环节。这项新成果把它拓展到纵向的疾病管理,也就是调整治疗、安排恰当的随访检查、并在反复就诊中开具处方这类更艰难、也更不光鲜的工作。为此,该系统依赖药物处方集和权威临床指南,研究也围绕英国 NICE 指南和 BMJ Best Practice 来构建案例。
在底层,用于管理的 AMIE 是两个协同工作的智能体:一个负责与患者实时对话的共情型对话智能体,以及一个会在拟定方案前交叉比对数百页临床知识的深度思考推理智能体。这场对照是盲法进行的,由专科医生在这一百个情景中为 AMIE 和人类医生的管理方案评分,而不知道哪份方案出自谁手。
这些局限和标题同样值得关注。受试的是专业的标准化病人,处于模拟的多次就诊问诊中,这意味着该研究捕捉到的是受控环境下临床推理的质量,而非真实病人的真实结果。这是研究,而非任何人都能使用的产品,Google 也谨慎地将其定位为有朝一日可能为医生提供支持、争取更多时间,而非取代医生。在真实诊疗中的测试是另一项仍在进行的独立工作,其中包括一项面向真实虚拟诊疗中 AI 的全国性随机研究。在纸面上符合一份指南,并不等同于在真实身体里管理一种真实的疾病。
尽管如此,这个方向仍然重要。诊断只是单一的时刻,而管理则是漫长、重复的苦功,医学的大部分其实就发生在这里,也正是忙碌的临床医生最常偏离指南的地方。一个精确且符合指南的 AI,原则上可以把时间还给医生。它与 OpenAI 声称某个模型帮助改进了一项真实化学反应在同一周登场,这是把前沿模型对准专家工作这一更大趋势中的两个数据点。同样的谨慎适用于两者:在研究中追平是真切的信号,而从受控对照跨越到混乱现实这一步,恰恰是双方都尚未展示出来的部分。
