波士顿儿童医院与哈佛的研究人员同 OpenAI 合作, 在经过同行评审的期刊 NEJM AI 上报告, 该公司的 o3 模型帮助为 18 名罕见病一直未能确诊的儿童厘清了新的诊断结果。与本周大多数医疗 AI 公告不同, 这一次背后有真实的患者, 真实的诊断和同行评审。

团队让 o3 分析了数百份长年得不到答案的患者的基因组, 把它用作医院所称的副驾驶遗传学家: 一套整合基因数据, 患者临床表型以及全球医学文献, 提出候选解释, 再由人类遗传学家加以评估的系统。在这批病例中, 它为接近 5% 的病例给出了新诊断, 即研究中的 18 例, 而医院表示, 其更广泛的副驾驶项目迄今已促成 40 多例曾被认为不可能的诊断。

对罕见病患者家庭来说, 这个数字并不抽象。诊断之路可能要走上数年, 充满反复的检查, 死胡同, 以及无法为病症命名的茫然, 而一个正确的答案就能改变治疗方案, 结束这场漫长的寻找, 并把一个家庭与患有同样病症的其他人联系起来。这里的承诺并不是 AI 取代遗传学家, 而是它能在有限的时间里, 比人读更多文献, 交叉比对更多的基因组, 再把一份候选清单交回给临床医生确认。

那些告诫是诚实的。5% 的比例意味着绝大多数疑难病例仍无解, 模型只是提出候选项而非确认, 而且每一次判断都有人类专家把关。但它仍与本周更花哨的说法形成对比: 一家图像公司发布了未经验证的全身扫描仪, 一项新的基准测试显示最强的模型只完成了约三分之一的专家级科学任务, 而这是一项规模更小, 有根有据, 有同行评审和真实儿童支撑的成果。真实, 朴素, 且经过核验, 本身就是一种头条。