MIT 本周发布了一个开源 AI 模型,可在认知症状出现前数年识别阿尔茨海默病风险,声称比之前的临床前方法精度高 4 倍。权重、训练代码和评估管线通过阿尔茨海默病数据倡议平台公开。对于有家族痴呆病史的人、考虑早期干预试验的临床医生、想要在此基础上构建的研究人员 —— 这是首个在 WW-FINGERS 网络多国数据集上训练的开放模型。

模型名为 FINGERS-7B,来自 MIT 的 Picower 学习与记忆研究所(由 Li-Huei Tsai 主任)。主要研究人员:Broad 研究所的 Arvid Gollwitzer 和 MIT-Novo Nordisk AI Fellow Adrian Noriega。方法论的转变是联合多模态训练 —— 生活方式记录、临床病史、基因组数据和蛋白质组生物标志物输入到一个模型中,而不是将单独的预测器拼接起来。训练数据来自 WW-FINGERS 网络,这是一个 40 国合作项目,约 3 万名参与者,建立在 Miia Kivipelto 教授的原始 FINGER 试验之上,将临床/生活方式记录与合作实验室的基因组和蛋白质组数据相结合。模型为每个个体产生三个输出:估计的阿尔茨海默病风险、预计的认知衰退轨迹,以及预测的干预反应 —— 哪种生活方式或临床干预可能帮助哪个人。声称的收益:临床前诊断比以前方法精确 4 倍,响应者分层改进 130%。

阿尔茨海默病研究在历史上一直缓慢地获得开源 ML 基础设施,该基础设施需要将人口规模的数据与完全的权重透明度相结合。大多数以前的风险预测工作使用专有队列或封闭权重 —— 论文可读但模型不能跑。FINGERS-7B 部署在 AD Workbench 中,这是阿尔茨海默病数据倡议的安全云平台,这意味着研究人员可以在自己的受保护健康数据上应用该模型,而无需将 PHI 外泄到外部 API。预印本在 OpenReview 上(id:fVqvRQ6XRV)。对于更广泛的 AI 健康发布模式,这更接近 BigBio/MedLM 开放数据形式,而不是 FDA 批准的黑箱形式 —— 这种区别对于谁可以无许可证障碍地构建衍生工作很重要。

这是预印本,尚未经过同行评审 —— 4 倍和 130% 的数字带有通常的注意事项:小效应量可以移动头条比率,基线方法很重要,针对未来队列的验证才是真正的测试。WW-FINGERS 数据集在起源上也倾向欧洲;推广到其他人群需要单独工作。但对于任何从事生物医学 ML 工作的人,或任何对痴呆症预防有家庭兴趣的人,这是最近朝着可在单个实验室之外使用的早期检测工具迈出的最具体的步骤之一。