Google ha publicado un estudio en Nature que muestra que su IA medica, AMIE, puede hacer mas que diagnosticar: puede ayudar a manejar enfermedades a lo largo del tiempo. En una comparacion aleatorizada y ciega frente a 21 medicos de atencion primaria, sobre 100 escenarios de multiples visitas, AMIE igualo o supero a los medicos en el razonamiento general del manejo y obtuvo mejor puntaje que ellos en la precision del plan y en el alineamiento con las guias clinicas. La salvedad crucial esta justo al lado del resultado: los pacientes eran actores entrenados, no personas reales.
AMIE, sigla de Articulate Medical Intelligence Explorer, comenzo como un sistema de conversacion diagnostica, y el trabajo anterior se centraba en el encuentro puntual de averiguar que esta mal. El nuevo resultado lo extiende al manejo longitudinal de enfermedades, la tarea mas dificil y menos vistosa de ajustar tratamientos, solicitar las pruebas de seguimiento correctas y prescribir a lo largo de visitas repetidas. Para lograrlo, el sistema se apoya en vademecums de medicamentos y en guias clinicas de referencia, y el estudio construyo sus casos a partir de las guias NICE del Reino Unido y de BMJ Best Practice.
Por dentro, AMIE para el manejo son dos agentes que trabajan juntos: un agente de dialogo empatico que se encarga de la conversacion en tiempo real con el paciente, y un agente de razonamiento profundo que coteja cientos de paginas de conocimiento clinico antes de exponer un plan. La comparacion fue ciega, con medicos especialistas que puntuaron los planes de manejo de AMIE y de los medicos humanos sin saber cual era cual, a lo largo de los cien escenarios.
Los limites merecen tanta atencion como el titular. Se trataba de pacientes actores profesionales en consultas simuladas de multiples visitas, lo que significa que el estudio capta la calidad del razonamiento clinico en un entorno controlado, no los resultados reales en personas enfermas. Es investigacion, no un producto que alguien pueda usar, y Google tiene cuidado de plantearlo como algo que algun dia podria apoyar a los medicos y darles mas tiempo, no reemplazarlos. Las pruebas en la atencion real son un esfuerzo aparte y en curso, que incluye un estudio aleatorizado a escala nacional sobre IA en la atencion virtual real. Igualar una guia sobre el papel no es lo mismo que manejar una enfermedad real en un cuerpo real.
Aun asi, la direccion importa. El diagnostico es un solo momento, mientras que el manejo es la rutina larga y repetitiva donde de hecho ocurre la mayor parte de la medicina y donde los clinicos atareados se apartan con mas frecuencia de las guias. Una IA precisa y alineada con las guias podria, en principio, devolverles tiempo a los medicos. Llega la misma semana que la afirmacion de OpenAI de que un modelo ayudo a mejorar una reaccion quimica real, dos datos dentro de un impulso mas amplio por orientar los modelos de frontera hacia el trabajo experto. La misma cautela aplica a ambos: igualar en un estudio es una senal genuina, y el salto de una comparacion controlada a la realidad caotica es justamente la parte que ninguno ha demostrado todavia.
