医疗影像 AI 正在悄悄撞上一个值得构建者注意的拐点。常规的高场 MRI 机器造价 100 万到 300 万美元,需要液氦,需要有重型屏蔽的专用机房,一个地区往往只在少数几家医院里。低场 MRI 机器(场强大约在 0.05 到 0.5 特斯拉,而不是 1.5 到 3 特斯拉)只要前者的一小部分钱,能在普通电源插座上跑,不需要氦,也能放进较小的设施里。一直以来的代价是图像质量:信号更弱、噪声更多、分辨率更低。AI 现在正在把这条差距压下去。已经发表的临床研究报告,在特定成像任务上、约 100 名受试者的队列中,AI 增强的低场 MRI 的结果已经能和常规机器平起平坐。文献中一台 0.05T 的参考机器耗电约 1800 瓦,和一把吹风机差不多。
AI 这一层在做三件事。第一,用低场-高场配对扫描训练的超分重建,让模型把噪声大的低场数据上采样到接近高端硬件输出的质量。第二,去噪扩散与基于 Transformer 的方法,在不引入早期 GAN 类方法那种「幻觉出来的解剖结构」的前提下,处理较低的信噪比。第三,针对特定解剖部位(脑、肺、肌骨)训练的重建模型,通过解剖先验来弥补低场物理在对比度上的损失。大厂把这类能力以不同商标推出:西门子的 Deep Resolve、GE 的 Effortless Imaging AI、Hyperfine 的便携 Swoop 系统。独立学术界的工作也在开放数据集上复现了核心结果。注意事项是:AI 重建出来的影像,对研究充分的常见解剖结构和常见病理是可诊断可用的;罕见发现、非典型表现、在训练数据里严重欠代表的解剖部位,就是重建最容易掉链子的地方,而围绕这一块的监管图景还在成形。
这是一个值得被命名的模式,因为它一直在反复出现。智能手机相机把卡片机干掉,不是因为小感光元件在物理上追上了大传感器,而是因为计算摄影(多帧融合、深度去噪、用于人像模式的语义分割)跨过了物理质量的鸿沟。降噪耳机在音频上走的也是同一条路。现在 AI 重建在医疗影像上重演了一遍。能够一般化的那句话是:当一项物理测量偏噪声、低分辨或昂贵时,一张用高质量配对参考训练出来的神经网络,经常能在硬件成本的很小一部分上把差距补上。这在信号自身结构足够、让模型能「猜」出昂贵版本会产生什么的场景下成立,而大多数生物与物理世界信号都属于这一类。它不成立的场景,是便宜传感器采到的信号在信息意义上就是真的太稀了,没有哪种先验能把从来没被采到过的数据「造」出来。对构建者来说,一条有用的准则是:永远先问问自己,你为硬件多付的这部分成本,是在为物理买单,还是在为便利买单;后一种往往是可替换的。
如果你在做医疗影像产品,现实的问题是:你这套具体的「低场 + AI」堆栈会走哪条监管路径。FDA 已经批准了多家厂商的系统,但合规的负担是按模型、按适应症一项一项走的,所以在大多数情况下,基于已经过审的重建 API 做原型,比你自己另起炉灶更快。如果你在做更广义的硬件相邻 AI,有三条具体的经验法则。第一,去找那些高端硬件比预算硬件贵 10 倍到 100 倍的领域,然后问:被以不同方式测量的究竟是哪一种物理量?如果差距主要在信噪比,而不在根本灵敏度,那 AI 重建大概率可行。第二,配对数据才是护城河,不是模型;谁手上有这个领域里大规模的「便宜-高端」配对测量数据,谁就先把重建做出来。第三,你在上面做原型的硬件平台,远远没有「你能拿到什么训练数据」重要;一个便宜但 API 友好的传感器,总是胜过一个更强但数据通路被锁住的传感器。医疗影像是这波迁移中目前最显眼的一个案例。类似的动力学正在开始在显微成像、卫星影像、工业检测里起作用,构建者的这一套思路是可以迁移过去的。
