Google 在 Nature 發表一項研究,顯示其醫療 AI「AMIE」能做的不只是診斷:它還能協助長期管理疾病。在一項隨機、盲性的比較中,AMIE 與 21 位基層醫師就 100 個多次就診情境一較高下,結果在整體管理推理上與醫師相當或更勝一籌,並在治療計畫的精準度與臨床指引契合度上得分高於醫師。一項關鍵的但書就緊貼在這項結果旁邊:這些病人是受過訓練的標準化病人,而非真實患者。
AMIE 是 Articulate Medical Intelligence Explorer 的縮寫,最初是一套診斷對話系統,早期的研究聚焦於釐清病灶這類一次性的問診。這項新成果將其延伸至長期疾病管理,也就是調整治療、安排適當的後續檢查,以及在反覆就診中開立處方等更艱難、也更不光鮮的工作。為了做到這一點,這套系統仰賴藥物處方集與權威臨床指引,而這項研究是以英國 NICE 指引與 BMJ Best Practice 為基礎來建構案例。
在底層運作上,負責管理的 AMIE 由兩個協同合作的代理人構成:一個富同理心的對話代理人,負責與病人即時對話;以及一個深度思考的推理代理人,會在擬定計畫前交叉比對數百頁的臨床知識。這項比較採盲性設計,由專科醫師為來自 AMIE 與來自人類醫師的管理計畫評分,且在這 100 個情境中都不知道哪一份出自誰手。
這些限制與標題同樣值得關注。受測的是專業的標準化病人,置身於模擬的多次就診諮詢中,這意味著這項研究捕捉到的是受控環境下的臨床推理品質,而非真實病患的實際結果。這是研究,而非任何人都能使用的產品,Google 也謹慎地將其定位為未來或許能支援醫師、讓他們多出時間,而非取而代之。在真實照護場域中的測試是另一項持續進行中的工作,其中包括一項在實際虛擬照護中針對 AI 的全國性隨機研究。在紙面上契合指引,與在真實身體裡管理一場真實的疾病,並不是同一回事。
儘管如此,方向仍然重要。診斷只是單一時刻,管理卻是漫長而反覆的磨工,醫學絕大部分其實都發生在這裡,也正是忙碌的臨床醫師最常偏離指引之處。一套精準且契合指引的 AI,原則上能把時間交還給醫師。它與 OpenAI 宣稱有一個模型協助改善了一項真實化學反應在同一週問世,這是將前沿模型導向專家工作這股更大浪潮中的兩個資料點。同樣的審慎適用於兩者:在研究中表現相當是真實的訊號,而從受控比較跨入混亂現實的那一躍,正是兩者都尚未展現的部分。
