O Google publicou um estudo na Nature mostrando que sua IA medica, a AMIE, pode fazer mais do que diagnosticar: ela pode ajudar a manejar doencas ao longo do tempo. Em uma comparacao randomizada e cega contra 21 medicos de atencao primaria em 100 cenarios de multiplas consultas, a AMIE igualou ou superou os medicos no raciocinio geral de manejo e obteve nota mais alta do que eles em precisao do plano e aderencia as diretrizes clinicas. A ressalva crucial fica logo ao lado do resultado: os pacientes eram atores treinados, e nao pessoas reais.

A AMIE, sigla para Articulate Medical Intelligence Explorer, comecou como um sistema de conversa para diagnostico, e os trabalhos anteriores focavam no encontro pontual de descobrir o que esta errado. O novo resultado a estende ao manejo longitudinal de doencas, o trabalho mais dificil e menos glamouroso de ajustar o tratamento, solicitar os exames de acompanhamento corretos e prescrever ao longo de consultas repetidas. Para isso, o sistema se apoia em formularios de medicamentos e em diretrizes clinicas de referencia, e o estudo construiu seus casos em torno das orientacoes do NICE, do Reino Unido, e do BMJ Best Practice.

Por tras dos bastidores, a AMIE para manejo sao dois agentes trabalhando juntos: um agente de dialogo empatico que conduz a conversa em tempo real com o paciente, e um agente de raciocinio profundo que cruza centenas de paginas de conhecimento clinico antes de tracar um plano. A comparacao foi cega, com medicos especialistas avaliando os planos de manejo da AMIE e dos medicos humanos sem saber qual era qual, ao longo dos cem cenarios.

Os limites merecem tanta atencao quanto a manchete. Eram pacientes atores profissionais em consultas simuladas de multiplas visitas, o que significa que o estudo capta a qualidade do raciocinio clinico em um ambiente controlado, e nao desfechos reais para pessoas doentes. Trata-se de pesquisa, e nao de um produto que alguem possa usar, e o Google tem o cuidado de apresenta-la como algo que um dia poderia apoiar os medicos e lhes dar mais tempo, nao substitui-los. Os testes no atendimento real sao um esforco separado e em andamento, incluindo um estudo randomizado de ambito nacional sobre IA no atendimento virtual real. Igualar uma diretriz no papel nao e o mesmo que manejar uma doenca real em um corpo real.

Ainda assim, a direcao importa. O diagnostico e um unico momento, enquanto o manejo e a rotina longa e repetitiva em que a maior parte da medicina de fato acontece e na qual os medicos sobrecarregados mais costumam se afastar das diretrizes. Uma IA que seja precisa e alinhada as diretrizes poderia, em principio, devolver tempo aos medicos. O resultado chega na mesma semana que a afirmacao da OpenAI de que um modelo ajudou a aprimorar uma reacao quimica real, dois pontos de dados em um movimento mais amplo de apontar modelos de fronteira para o trabalho de especialistas. A mesma cautela serve para os dois: igualar em estudo e um sinal genuino, e o salto de uma comparacao controlada para a realidade baguncada e exatamente a parte que nenhum dos dois ainda demonstrou.