A colunista do WSJ Joanna Stern, em seu livro I Am Not a Robot discutido no podcast Hard Fork do New York Times em 8 de maio, expõe um problema com ferramentas AI de triagem dental que os builders vendendo para workflows clínicos deveriam rastrear. A Pearl AI sinalizou o escaneamento dental de Stern como precisando de quatro sessões de tratamento periodontal custando milhares; múltiplos dentistas vendo as mesmas imagens discordaram. Pearl AI e Overjet são os fornecedores nomeados, ambos incumbentes bem-financiados no espaço de AI radiográfica dental. O pitch de marketing da Pearl a dentistas, citado no writeup da Futurism: práticas que a usam encontram "37 por cento mais doença e entregam 24 por cento mais atendimento aos pacientes."

O claim de marketing é a parte arquiteturalmente interessante, separada da experiência de qualquer paciente. Um produto AI vendido ao seu operador sobre uplift de receita — "você vai faturar mais depois de nos desplegar" — é qualitativamente diferente de um vendido sobre melhoria de exatidão — "seus diagnósticos serão mais corretos." O pitch da Pearl combina os dois: o 37% surge como claim de melhoria de detecção, o 24% como consequência de faturamento. Se os dados de desplegamento suportam o número de detecção em coortes de pacientes out-of-sample comparados contra consenso de experts, o faturamento segue. Se o número de detecção é deriva de calibração rumo a falsos positivos, o faturamento é iatrogênico. O artigo não traz à tona estudos de validação publicados, leituras comparativas grau-clearance FDA, ou dados de auditoria de terceiros que permitiriam a um observador externo dizer qual.

Coloque isto contra a auditoria desta manhã do auditor geral de Ontário: 20 de 20 fornecedores de AI scribes mostraram inexatidões durante o testing de aquisição. Dois domínios, dois modos de falha — fabricação de notas do lado scribe, inflação diagnóstica possível do lado imagem — mas a mesma lacuna subjacente: o desplegamento está ultrapassando a avaliação de terceiros. Fornecedores de AI dental ainda não enfrentam o tipo de escrutínio de auditoria provincial que Ontário aplicou aos scribes; o mercado dental dos EUA é dominado por pagadores privados, o que muda a alavancagem do regulador. Fique de olho na FDA, nos conselhos dentais estaduais, e nas principais seguradoras dentais como os órgãos que poderiam publicar seus próprios estudos comparativos uma vez que anedotas grau-Stern se acumulem o suficiente.

Segunda-feira: se você constrói ou vende AI clínica, a linha entre "melhora a detecção" e "aumenta procedimentos faturáveis" é a linha que seu copy de marketing não deveria borrar, independentemente de como o mercado dental atualmente premia o borrão. Se você é dentista desplegando essas ferramentas, a pergunta grau-auditoria não é qual é o número de melhoria que o fornecedor reivindica — é se um dentista humano second-reader concorda com os flags da AI a uma taxa que exceda a concordância inter-rater humana sobre as mesmas imagens sem AI. Esse é o harness; o fornecedor tem os dados ou não. Se você está escolhendo quais segmentos de AI clínica atacar, a ausência de dados de validação pública em imagem dental é ou uma oportunidade (seja o fornecedor que os publica) ou um aviso (o segmento pode ser reprecificado quando outro fizer).