Google a publie une etude dans Nature montrant que son IA medicale, AMIE, peut faire plus que diagnostiquer: elle peut aider a gerer des maladies dans le temps. Dans une comparaison randomisee et a l'aveugle face a 21 medecins de premiere ligne sur 100 scenarios a visites multiples, AMIE a egale ou depasse les medecins sur le raisonnement global de gestion, et a obtenu de meilleures notes qu'eux sur la precision du plan et la conformite aux recommandations cliniques. La reserve essentielle se tient juste a cote du resultat: les patients etaient des acteurs formes, pas de vraies personnes.

AMIE, pour Articulate Medical Intelligence Explorer, a debute comme un systeme de conversation diagnostique, et les travaux precedents portaient sur la rencontre ponctuelle consistant a determiner ce qui ne va pas. Le nouveau resultat l'etend a la gestion des maladies dans la duree, le travail plus difficile et moins spectaculaire d'ajuster le traitement, de prescrire les bons examens de suivi et de renouveler les ordonnances au fil de visites repetees. Pour cela, le systeme s'appuie sur les formulaires de medicaments et sur des recommandations cliniques de reference, et l'etude a bati ses cas autour des recommandations du NICE britannique et de BMJ Best Practice.

Sous le capot, AMIE pour la gestion repose sur deux agents qui travaillent ensemble: un agent de dialogue empathique qui mene la conversation en temps reel avec le patient, et un agent de raisonnement approfondi qui croise des centaines de pages de savoir clinique avant d'exposer un plan. La comparaison etait a l'aveugle, des medecins specialistes notant les plans de gestion d'AMIE et ceux des medecins humains sans savoir lesquels etaient lesquels, sur les cent scenarios.

Les limites meritent autant d'attention que le titre. Il s'agissait de patients acteurs professionnels dans des consultations simulees a visites multiples, ce qui signifie que l'etude saisit la qualite du raisonnement clinique en cadre controle, pas de vrais resultats pour des personnes malades. C'est de la recherche, pas un produit que quiconque peut utiliser, et Google prend soin de la presenter comme quelque chose qui pourrait un jour epauler les medecins et leur donner plus de temps, pas les remplacer. Les tests en conditions reelles forment un effort distinct et toujours en cours, dont une etude randomisee a l'echelle nationale portant sur l'IA dans des soins virtuels reels. Respecter une recommandation sur le papier n'est pas la meme chose que gerer une vraie maladie dans un vrai corps.

Reste que la direction compte. Le diagnostic est un instant unique, tandis que la gestion est le long travail repetitif ou se joue l'essentiel de la medecine et ou les cliniciens debordes s'ecartent le plus souvent des recommandations. Une IA precise et conforme aux recommandations pourrait, en principe, redonner du temps aux medecins. Elle arrive la meme semaine que l'affirmation d'OpenAI selon laquelle un modele a aide a ameliorer une vraie reaction chimique, deux points de donnees dans une poussee plus large visant a orienter les modeles de pointe vers le travail d'expert. La meme prudence vaut pour les deux: l'egalite obtenue en etude est un signal authentique, et le passage d'une comparaison controlee a une realite desordonnee est precisement la partie qu'aucun des deux n'a encore demontree.