Mitchell Katz, CEO da NYC Health and Hospitals — o maior sistema de saúde pública da América com 11 hospitais — declarou em um painel da Crain's que sua organização poderia "substituir grande parte dos radiologistas por IA neste momento, se estivermos prontos para enfrentar o desafio regulatório". Katz citou especificamente a automatização do rastreamento de câncer de mama, mantendo radiologistas de sobreaviso apenas quando a IA sinalizar leituras anormais para "grandes economias". Isso vem semanas depois da maior greve de enfermeiras da história de NYC.

O momento não poderia ser pior para o hype da IA em radiologia. Nova pesquisa de Stanford revela que modelos de IA de fronteira podem passar perfeitamente em testes de referência médicos em raios-X do tórax sem nunca ver as imagens reais — o que os pesquisadores chamam de "miragens de IA". Diferente das alucinações típicas, essas miragens produzem explicações racionais e coerentes para achados que não existem. Os modelos simulam todo o processo diagnóstico sem estar ancorados em nada, tornando as salvaguardas padrão contra alucinações inúteis.

O radiologista Mohammed Suhail da North Coast Imaging chamou os comentários de Katz de "prova inegável de que administradores hospitalares confiantes mas desinformados são um perigo para os pacientes" e alertou que "qualquer tentativa de implementar leituras apenas por IA resultaria imediatamente em danos e mortes de pacientes". A avaliação de Suhail se alinha com os achados de Stanford — modelos de linguagem visual permanecem funcionalmente cegos apesar de parecerem competentes em testes de referência.

Para desenvolvedores construindo ferramentas de IA médica, este é um alerta sobre metodologia de avaliação. Se seus modelos podem passar em testes sem ver imagens, seus benchmarks estão quebrados. Administradores de saúde procurando soluções de IA precisam entender a diferença entre desempenho em benchmarks e confiabilidade do mundo real — especialmente quando vidas estão em jogo.