OpenAI 發表了該公司所稱在有機化學上近乎自主的發現。該公司表示,GPT-5.4 搭配 Molecule.one 的 Maria AI 與一座專門實驗室,推動一項藥物化學專案從文獻回顧一路走到經過驗證的實驗結果,找出一種出乎意料的方式,改良一項在藥物開發中廣泛使用的反應。整個過程中都由人類化學家主導方向,而這正是這則故事中與標題同等重要的部分。
分工相當明確。GPT-5.4 閱讀科學文獻、生成並排序研究提案、協助設計實驗、分析結果並提出後續方向。出自新創公司 Molecule.one 的化學系統 Maria AI,則以運算方式在 10,080 個反應中測試這些提案。人類化學家挑選出值得執行的提案,親手進行實體驗證並撰寫研究發現。OpenAI 表示,整個流程約耗時兩個半月,化學家另外再花約半個月來記錄成果。
目標是硼酸與磺胺之間一項棘手的偶合反應,這是建構藥物分子的關鍵步驟。根據 OpenAI 的說法,受測的硼酸有 88% 產率提升,磺胺則有 83% 提升,而在化學家親手驗證的十四項代表性反應中,有十一項產率提高,其中八項提升超過一倍。如果這些數字經得起外界檢驗,那麼這對一項真實技術而言,是一項雖然狹窄卻貨真價實的改良。
這樣的表述很快招來化學家的反駁。多位化學家指出,這套做法看起來很像高通量篩選再接上一具 AI 引擎來繪製變數圖譜,而自動化實驗室自 1990年代機器人技術變得可靠以來便一直在做這件事,這使得其突破性不如那些字眼所暗示的那般新穎。其他人則反對將這套系統稱為 AI 化學家,或把這項發現稱為自主,因為方向由人設定、提案由人挑選、結果由人確認,他們並形容 OpenAI 自家的研究報告過於擬人化。較公允的解讀是,這是一場由人類監督的循環所產生、真實且經過驗證的成果,而非一台機器獨立運作的結果。
這項成果出現在外界大舉推動前沿模型投入科學的背景之中,包括 OpenAI 自家面向生命科學的 GPT-Rosalind 系列,以及其用於端到端研究任務的 LifeSciBench 基準測試。這裡有意思的主張並非 AI 取代了化學家,而是一套由專家主導的通用型模型,將數個月的提出與測試的反覆迭代壓縮進一個更緊湊的循環,並浮現出值得確認的線索。這套做法能否在單一反應之外重現,以及所節省的時間能否在面對更棘手的問題後依然成立,正是下一批結果必須回答的問題。
