Helmholtz Munich、慕尼黑工业大学和 Stowers Institute for Medical Research 的研究人员发布了 RegVelo,这是一个预测发育轨迹并识别驱动细胞命运决策的调控相互作用的深度学习框架。验证很重要:预测通过 CRISPR/Cas9 敲除和 Perturb-seq 在细胞周期进展、胰腺内分泌发生、造血和斑马鱼神经嵴分化中进行了实验测试 —— 该工具成功恢复了所有四个系统中所有已知的终端细胞状态。来自细胞周期数据的具体数字:跨边界正确性 0.864/1.0、速度一致性 0.873、与 FUCCI ground-truth 分数的 Spearman 相关性 0.683。作为 bioRxiv 预印本发表,同行评审待定。
RegVelo 结合了两种现有的单细胞分析技术,并端到端学习联合模型。RNA 速度(La Manno 等,2018)从 scRNA-seq 数据中未剪接 mRNA 与剪接 mRNA 的比率推断发育方向 —— 快速变化的转录本表明细胞在状态空间中向哪个方向移动。基因调控网络推理识别转录因子级联中谁调控谁。两者单独使用都有用,但产生不同的有时矛盾的预测。RegVelo 的贡献是一个神经网络,它编码 scRNA-seq 数据,通过一个产生细胞-基因特异性潜在时间的解码器,然后在一次传递中联合推断速度和调控网络。输出:对于任何细胞,预测下一个状态、驱动转变的基因,以及当你扰动特定调控因子时会发生什么。Perturb-seq 验证是黄金标准 —— 实际使用 CRISPR 敲除预测的调控因子、测量结果,并与 RegVelo 的实验前预测进行比较。第一作者 Weixu Wang,共同资深作者 Fabian J. Theis(Helmholtz Munich)和 Tatjana Sauka-Spengler(Stowers Institute,TU Munich)。Theis 实验室十年来一直是领先的单细胞 ML 小组之一 —— 2018 年的 scVI,scvi-tools 自那以来成为该领域的标准 —— 所以这个结果不是一次性的。
单细胞 ML 领域大约五年来一直在向这一精确整合发展。scVI(Theis 实验室,2018)是第一个用于 scRNA-seq 批次校正的大型深度学习模型。cellxgene 和 Human Cell Atlas 构建了数据基础设施。RNA 速度于 2018 年作为单独的轨道到达。基因调控网络已用较浅方法(GENIE3、ARACNe)推断。RegVelo 是综合:一个模型,端到端学习,有跨四个细胞系统的实验验证预测。这个模式很重要,因为细胞命运预测是大多数再生医学、药物发现和发育生物学的上游问题 —— 知道扰动哪个基因将细胞从一个命运推向另一个,是下游真正可作为治疗构建的。CoCoGraph(#814)和 FINGERS-7B(#808)在同一更广泛的线索中是同伴:生物学变得 AI 可处理,不仅在分子水平(CoCoGraph)或诊断水平(FINGERS-7B)上,而且在细胞命运决策水平(RegVelo)上。Theis-lab/Stowers/TU Munich 合作很重要,因为它不是一个供应商产品 —— 这是学术单细胞 ML 社区交付其当前最佳的联合推理。
bioRxiv 预印本,同行评审待定。公告中未指定代码/开源 —— Theis 实验室通常交付开源(scvi-tools 被广泛使用),所以如果同行评审干净地完成,期待发布。对于在职生物学家:跨四个测试系统的 CRISPR/Perturb-seq 验证是强信号 —— RegVelo 的预测对抗实验黄金标准成立,不仅对抗 in-silico 持出测试集。对于观察 bio-ML 的建设者:联合推理模式(通过深度学习骨干端到端组合已建立的技术,而不是分开运行它们并缝合输出)是架构教训,它将在其他单细胞模态中被复制。对于更广泛的受众:这就是「生物学 AI」严肃的样子 —— 具体的机构实验室、被统一的命名技术、对建立的黄金标准的实验验证、没有关于治愈疾病的喘息声明、只是在使下游疗法成为可能的上游预测问题上的可测量改进。
