Helmholtz Munich、慕尼黑工業大學和 Stowers Institute for Medical Research 的研究人員發布了 RegVelo,這是一個預測發育軌跡並識別驅動細胞命運決策的調控相互作用的深度學習框架。驗證很重要:預測透過 CRISPR/Cas9 敲除和 Perturb-seq 在細胞週期進展、胰腺內分泌發生、造血和斑馬魚神經嵴分化中進行了實驗測試 —— 該工具成功恢復了所有四個系統中所有已知的終端細胞狀態。來自細胞週期資料的具體數字:跨邊界正確性 0.864/1.0、速度一致性 0.873、與 FUCCI ground-truth 分數的 Spearman 相關性 0.683。作為 bioRxiv 預印本發表,同行評審待定。
RegVelo 結合了兩種現有的單細胞分析技術,並端到端學習聯合模型。RNA 速度(La Manno 等,2018)從 scRNA-seq 資料中未剪接 mRNA 與剪接 mRNA 的比率推斷發育方向 —— 快速變化的轉錄本表明細胞在狀態空間中向哪個方向移動。基因調控網路推理識別轉錄因子級聯中誰調控誰。兩者單獨使用都有用,但產生不同的有時矛盾的預測。RegVelo 的貢獻是一個神經網路,它編碼 scRNA-seq 資料,透過一個產生細胞-基因特異性潛在時間的解碼器,然後在一次傳遞中聯合推斷速度和調控網路。輸出:對於任何細胞,預測下一個狀態、驅動轉變的基因,以及當你擾動特定調控因子時會發生什麼。Perturb-seq 驗證是黃金標準 —— 實際使用 CRISPR 敲除預測的調控因子、測量結果,並與 RegVelo 的實驗前預測進行比較。第一作者 Weixu Wang,共同資深作者 Fabian J. Theis(Helmholtz Munich)和 Tatjana Sauka-Spengler(Stowers Institute,TU Munich)。Theis 實驗室十年來一直是領先的單細胞 ML 小組之一 —— 2018 年的 scVI,scvi-tools 自那以來成為該領域的標準 —— 所以這個結果不是一次性的。
單細胞 ML 領域大約五年來一直在向這一精確整合發展。scVI(Theis 實驗室,2018)是第一個用於 scRNA-seq 批次校正的大型深度學習模型。cellxgene 和 Human Cell Atlas 構建了資料基礎設施。RNA 速度於 2018 年作為單獨的軌道到達。基因調控網路已用較淺方法(GENIE3、ARACNe)推斷。RegVelo 是綜合:一個模型,端到端學習,有跨四個細胞系統的實驗驗證預測。這個模式很重要,因為細胞命運預測是大多數再生醫學、藥物發現和發育生物學的上游問題 —— 知道擾動哪個基因將細胞從一個命運推向另一個,是下游真正可作為治療構建的。CoCoGraph(#814)和 FINGERS-7B(#808)在同一更廣泛的線索中是同伴:生物學變得 AI 可處理,不僅在分子水平(CoCoGraph)或診斷水平(FINGERS-7B)上,而且在細胞命運決策水平(RegVelo)上。Theis-lab/Stowers/TU Munich 合作很重要,因為它不是一個供應商產品 —— 這是學術單細胞 ML 社區交付其當前最佳的聯合推理。
bioRxiv 預印本,同行評審待定。公告中未指定程式碼/開源 —— Theis 實驗室通常交付開源(scvi-tools 被廣泛使用),所以如果同行評審乾淨地完成,期待發布。對於在職生物學家:跨四個測試系統的 CRISPR/Perturb-seq 驗證是強信號 —— RegVelo 的預測對抗實驗黃金標準成立,不僅對抗 in-silico 持出測試集。對於觀察 bio-ML 的建設者:聯合推理模式(透過深度學習骨幹端到端組合已建立的技術,而不是分開運行它們並縫合輸出)是架構教訓,它將在其他單細胞模態中被複製。對於更廣泛的受眾:這就是「生物學 AI」嚴肅的樣子 —— 具體的機構實驗室、被統一的命名技術、對建立的黃金標準的實驗驗證、沒有關於治癒疾病的喘息聲明、只是在使下游療法成為可能的上游預測問題上的可測量改進。
