Microsoft本月推出了Copilot Health,允许用户连接医疗记录并直接通过其聊天机器人询问健康问题。几天前,Amazon将Health AI从其One Medical订阅用户扩展到普遍可用。这些举措加入了OpenAI的ChatGPT Health和Anthropic的Claude,形成了部署消费者健康AI的突然冲刺,由巨大需求驱动——仅Microsoft就通过Copilot每天处理5000万个健康问题。

时机绝非巧合。这些公司声称LLM已经跨越了能力门槛,可以安全地提供医疗建议。Microsoft的Dominic King是前外科医生,领导他们的健康AI工作,他指出"生成式AI在回答健康问题方面的能力取得了巨大进展"。但构建这些产品的公司进行自我评估,在医疗应用监管方面引发了红旗警告。

研究人员正在抵制缺乏独立评估的做法。虽然一些研究表明当前的LLM可以提供有用的健康建议,但专家们认为这些工具在广泛发布之前需要严格的第三方测试——而不仅仅是公司内部研究。Oxford的Andrew Bean说:"证据基础确实需要存在",强调了公司在评估自己的高风险产品时可能存在盲点的风险。

对于开发者和AI用户来说,这波浪潮既代表机遇也需要谨慎。需求显然是巨大的,技术能力可能终于存在了。但在没有独立安全验证的情况下构建或部署健康AI可能会让用户面临公司主导的评估可能遗漏的严重风险。