Investigadores del Boston Children's Hospital y de Harvard, en colaboracion con OpenAI, informan en la revista revisada por pares NEJM AI que el modelo o3 de la compania ayudo a esclarecer 18 nuevos diagnosticos en ninos cuyas enfermedades raras habian quedado sin resolver. A diferencia de la mayoria de los anuncios sobre IA medica de esta semana, este llega acompanado de pacientes reales, diagnosticos reales y revision por pares.

El equipo aplico o3 sobre varios cientos de genomas de pacientes que habian pasado anos sin una respuesta, usandolo como lo que el hospital llama un genetista copiloto: un sistema que reune datos geneticos, el fenotipo clinico del paciente y la literatura medica mundial para proponer explicaciones candidatas que luego evalua un genetista humano. En ese conjunto, produjo nuevos diagnosticos en cerca del 5 por ciento de los casos, 18 en el estudio, y el hospital afirma que su iniciativa mas amplia de genetista copiloto ha contribuido ya a mas de 40 diagnosticos que antes se consideraban imposibles.

Para las familias afectadas por enfermedades raras, esa cifra no es abstracta. Una odisea diagnostica puede prolongarse durante anos, llena de pruebas repetidas, callejones sin salida y la ausencia de un nombre para lo que esta mal, y una sola respuesta correcta puede cambiar el tratamiento, poner fin a la busqueda y conectar a una familia con otras que comparten la misma condicion. La promesa aqui no es que la IA reemplace al genetista, sino que puede leer mas de la literatura y cruzar mas del genoma de lo que una persona alcanza en el tiempo disponible, y luego devolver una lista corta al clinico para que la confirme.

Las salvedades son las honestas. Una tasa del 5 por ciento significa que la gran mayoria de los casos dificiles siguen sin resolverse, el modelo propone candidatos en lugar de confirmarlos, y un experto humano permanece en el circuito en cada decision. Pero se distingue de las afirmaciones mas llamativas de la semana: mientras una empresa de imagenes anuncio un escaner corporal completo sin validar y un nuevo benchmark mostro que los mejores modelos solo superaban alrededor de un tercio de las tareas cientificas de expertos, este es un resultado mas pequeno y bien fundamentado, con revision por pares y ninos reales detras. Real, modesto y verificado es su propio tipo de titular.