Investigadores en Helmholtz Munich, la Universidad Técnica de Munich y el Stowers Institute for Medical Research publicaron RegVelo, un marco de deep learning que predice trayectorias de desarrollo e identifica las interacciones regulatorias que dirigen las decisiones de destino celular. La validación importa: las predicciones fueron probadas experimentalmente vía knockouts CRISPR/Cas9 y Perturb-seq en progresión del ciclo celular, endocrinogénesis pancreática, hematopoyesis y diferenciación de cresta neural del pez cebra — y la herramienta recuperó exitosamente todos los estados celulares terminales conocidos a través de los cuatro sistemas. Cifras concretas de los datos del ciclo celular: exactitud cross-boundary 0,864/1,0, consistencia de velocidad 0,873, correlación de Spearman 0,683 contra puntuaciones ground-truth FUCCI. Publicado como preprint bioRxiv, revisión por pares pendiente.

RegVelo combina dos técnicas existentes de análisis single-cell y aprende el modelo conjunto end-to-end. La velocidad de ARN (La Manno et al., 2018) infiere la dirección de desarrollo del ratio de ARNm no empalmado a empalmado en datos scRNA-seq — transcripciones que cambian rápidamente indican hacia dónde se está moviendo una célula en el espacio de estados. La inferencia de red reguladora de genes identifica quién regula a quién en cascadas de factores de transcripción. Ambos son útiles solos pero producen predicciones diferentes y a veces contradictorias. La contribución de RegVelo es una red neuronal que codifica datos scRNA-seq, corre a través de un decodificador produciendo tiempo latente específico célula-gen, e infiere conjuntamente velocidad y red reguladora en una pasada. La salida: para cualquier célula, predice el siguiente estado, los genes dirigiendo la transición, y qué sucede cuando perturbas un regulador específico. La validación Perturb-seq es el estándar de oro — realmente knock out el regulador predicho con CRISPR, medir el resultado, y comparar contra la predicción pre-experimento de RegVelo. Primer autor Weixu Wang, co-autores senior Fabian J. Theis (Helmholtz Munich) y Tatjana Sauka-Spengler (Stowers Institute, TU Munich). El laboratorio de Theis ha sido uno de los grupos ML single-cell líderes durante una década — scVI en 2018, scvi-tools como estándar del campo desde entonces — así que el resultado no es un caso aislado.

El campo ML-single-cell ha estado construyendo hacia esta integración exacta durante aproximadamente cinco años. scVI (laboratorio Theis, 2018) fue el primer gran modelo de deep learning para corrección de batch scRNA-seq. cellxgene y el Human Cell Atlas construyeron la infraestructura de datos. La velocidad de ARN llegó como pista separada en 2018. Las redes reguladoras de genes han sido inferidas con métodos menos profundos (GENIE3, ARACNe). RegVelo es la síntesis: un modelo, aprendido end-to-end, con predicciones validadas experimentalmente a través de cuatro sistemas celulares. El patrón importa porque la predicción de destino celular es la pregunta aguas arriba para la mayoría de la medicina regenerativa, descubrimiento de fármacos y biología del desarrollo — saber qué gen perturbar para empujar una célula de un destino a otro es lo que efectivamente se construye como terapia aguas abajo. CoCoGraph (#814) y FINGERS-7B (#808) son compañeros en el mismo hilo amplio: la biología volviéndose tratable por IA no solo a nivel molecular (CoCoGraph) o de diagnóstico (FINGERS-7B) sino a nivel de decisión-destino-celular (RegVelo). La colaboración Theis-lab/Stowers/TU Munich importa porque no es un producto de vendor — es la comunidad académica ML single-cell entregando su mejor inferencia conjunta actual.

Preprint bioRxiv, revisión por pares pendiente. Código/open-source no especificado en el anuncio — el laboratorio Theis usualmente entrega open source (scvi-tools es ampliamente usado), así que esperar un lanzamiento si la revisión por pares se completa limpiamente. Para biólogos en ejercicio: la validación CRISPR/Perturb-seq a través de cuatro sistemas de prueba es la señal fuerte — las predicciones de RegVelo se mantuvieron contra el estándar de oro experimental, no solo contra sets de prueba in-silico apartados. Para constructores observando bio-ML: el patrón de inferencia conjunta (combinar técnicas establecidas end-to-end vía un backbone de deep learning en lugar de ejecutarlas por separado y coser las salidas) es la lección arquitectónica, y se copiará a través de otras modalidades single-cell. Para la audiencia más amplia: esto es a lo que se parece "IA para biología" cuando es serio — laboratorios institucionales específicos, técnicas nombradas siendo unificadas, validación experimental contra estándares de oro establecidos, sin afirmaciones jadeantes sobre curar enfermedades, solo mejoras medibles en el problema de predicción aguas arriba que hace posibles las terapias aguas abajo.