Helmholtz Munich, Technical University of Munich, और Stowers Institute for Medical Research के researchers ने RegVelo release किया, एक deep-learning framework जो developmental trajectories predict करता है और cell fate decisions को drive करने वाली regulatory interactions identify करता है। Validation matter करती है: predictions को experimentally CRISPR/Cas9 knockouts और Perturb-seq के माध्यम से cell-cycle progression, pancreatic endocrinogenesis, hematopoiesis, और zebrafish neural crest differentiation पर test किया गया — और tool ने सफलतापूर्वक चारों systems में सभी known terminal cell states recover किए। Cell-cycle data से concrete numbers: cross-boundary correctness 0.864/1.0, velocity consistency 0.873, FUCCI ground-truth scores के विरुद्ध Spearman correlation 0.683। bioRxiv preprint के रूप में published, peer review pending।
RegVelo दो मौजूदा single-cell analysis techniques को combine करता है और joint model end-to-end सीखता है। RNA velocity (La Manno et al., 2018) scRNA-seq data में unspliced से spliced mRNA के ratio से developmental direction infer करती है — तेजी से बदलने वाले transcripts indicate करते हैं कि cell state space में किस दिशा में जा रही है। Gene regulatory network inference transcription factor cascades में कौन किसको regulate करता है identify करता है। दोनों अकेले useful हैं लेकिन different और कभी-कभी contradictory predictions produce करते हैं। RegVelo का contribution एक neural network है जो scRNA-seq data को encode करता है, एक decoder से गुजरता है जो cell-gene-specific latent time produce करता है, और एक pass में velocity और regulatory network को jointly infer करता है। Output: किसी भी cell के लिए, next state predict करें, transition को drive करने वाले genes, और जब आप specific regulator perturb करते हैं तब क्या होता है। Perturb-seq validation gold standard है — predicted regulator को actually CRISPR से knock out करें, result measure करें, और RegVelo की pre-experiment prediction से compare करें। First author Weixu Wang, co-senior authors Fabian J. Theis (Helmholtz Munich) और Tatjana Sauka-Spengler (Stowers Institute, TU Munich)। Theis का lab एक दशक से leading single-cell ML groups में से एक रहा है — 2018 में scVI, तब से scvi-tools field standard के रूप में — तो result one-off नहीं है।
Single-cell-ML field लगभग पाँच साल से इस exact integration की ओर build कर रहा है। scVI (Theis lab, 2018) scRNA-seq batch correction के लिए पहला major deep-learning model था। cellxgene और Human Cell Atlas ने data infrastructure बनाया। RNA velocity 2018 में separate track के रूप में आई। Gene regulatory networks को shallower methods (GENIE3, ARACNe) से infer किया गया है। RegVelo synthesis है: एक model, end-to-end learned, चार cell systems पर experimentally validated predictions के साथ। Pattern matter करता है क्योंकि cell fate prediction अधिकांश regenerative medicine, drug discovery, और developmental biology के लिए upstream question है — कौन से gene को perturb करना है ताकि cell को एक fate से दूसरे में push किया जा सके वह है जो downstream therapy के रूप में actually buildable है। CoCoGraph (#814) और FINGERS-7B (#808) समान broader thread में companions हैं: biology AI-tractable बन रही है केवल molecule level (CoCoGraph) या diagnostic level (FINGERS-7B) पर नहीं बल्कि cell-fate-decision level (RegVelo) पर। Theis-lab/Stowers/TU Munich collaboration matter करता है क्योंकि यह एक vendor product नहीं है — यह academic single-cell-ML community अपनी current best joint inference ship कर रही है।
bioRxiv preprint, peer review pending। Announcement में code/open-source specify नहीं — Theis lab usually open source ship करता है (scvi-tools widely used है), तो peer review cleanly complete होने पर release expect करें। Working biologists के लिए: चार test systems में CRISPR/Perturb-seq validation strong signal है — RegVelo की predictions experimental gold standard के विरुद्ध टिकीं, सिर्फ in-silico held-out test sets के विरुद्ध नहीं। Bio-ML देख रहे builders के लिए: joint-inference pattern (deep learning backbone के माध्यम से established techniques को end-to-end combine करना बजाय उन्हें separately चलाने और outputs को stitch करने के) architectural lesson है, और यह अन्य single-cell modalities में copy होगा। व्यापक audience के लिए: यह वह है जो "AI for biology" तब दिखती है जब वह serious है — specific institutional labs, unified हो रही named techniques, established gold standards के विरुद्ध experimental validation, बीमारियों का इलाज करने के बारे में breathless claims नहीं, सिर्फ upstream prediction problem पर measurable improvements जो downstream therapies को संभव बनाते हैं।
