La columnista del WSJ Joanna Stern, en su libro I Am Not a Robot discutido en el podcast Hard Fork del New York Times el 8 de mayo, expone un problema con las herramientas AI de cribado dental que los builders que venden a workflows clínicos deberían trackear. Pearl AI marcó el escaneo dental de Stern como necesitando cuatro sesiones de tratamiento periodontal costando miles; múltiples dentistas que vieron las mismas imágenes no estaban de acuerdo. Pearl AI y Overjet son los proveedores nombrados, ambos incumbentes bien-financiados en el espacio de AI radiográfica dental. El pitch de marketing de Pearl a dentistas, citado en el writeup de Futurism: las prácticas que lo usan encuentran "37 por ciento más enfermedad y entregan 24 por ciento más atención a pacientes."
El reclamo de marketing es la parte arquitectónicamente interesante, separada de la experiencia de un paciente cualquiera. Un producto AI vendido a su operador sobre el uplift de ingresos — "vas a facturar más después de desplegarnos" — es cualitativamente diferente de uno vendido sobre mejora de exactitud — "tus diagnósticos serán más correctos." El pitch de Pearl combina ambos: el 37% surge como reclamo de mejora de detección, el 24% como consecuencia de facturación. Si los datos de despliegue soportan el número de detección en cohortes de pacientes out-of-sample comparados contra consenso de expertos, la facturación sigue. Si el número de detección es deriva de calibración hacia falsos positivos, la facturación es iatrogénica. El artículo no aflora estudios de validación publicados, lecturas comparativas grado-clearance FDA, o datos de auditoría de terceros que le permitan a un observador externo decir cuál.
Pon esto contra la auditoría de esta mañana del auditor general de Ontario: 20 de 20 proveedores de AI scribes mostraron inexactitudes durante el testing de adquisición. Dos dominios, dos modos de falla — fabricación de notas del lado scribe, inflación diagnóstica posible del lado imagen — pero la misma brecha subyacente: el despliegue está superando la evaluación de terceros. Los proveedores de AI dental aún no enfrentan el tipo de escrutinio de auditoría provincial que Ontario aplicó a los scribes; el mercado dental estadounidense está dominado por pagadores privados, lo que cambia el apalancamiento del regulador. Vigila a la FDA, las juntas dentales estatales, y los principales aseguradores dentales como los cuerpos que podrían publicar sus propios estudios comparativos una vez que se acumulen suficientes anécdotas grado-Stern.
Lunes: si construyes o vendes AI clínica, la línea entre "mejora la detección" y "aumenta procedimientos facturables" es la línea que tu copy de marketing no debería difuminar, independientemente de cómo el mercado dental actualmente premie la difuminación. Si eres dentista desplegando estas herramientas, la pregunta grado-auditoría no es cuál es el número de mejora reclamado por el proveedor — es si un dentista humano second-reader está de acuerdo con los flags del AI a una tasa que exceda el acuerdo inter-rater humano sobre las mismas imágenes sin AI. Ese es el harness; el proveedor tiene los datos o no. Si estás eligiendo qué segmentos de AI clínica atacar, la ausencia de datos de validación pública en imagen dental es o una oportunidad (sé el proveedor que los publica) o una advertencia (el segmento puede ser repreciado cuando alguien más lo haga).
