La chroniqueuse WSJ Joanna Stern, dans son livre I Am Not a Robot discuté sur le podcast Hard Fork du New York Times le 8 mai, expose un problème avec les outils AI de dépistage dentaire que les builders qui vendent dans les workflows cliniques devraient tracker. Pearl AI a flag le scan dentaire de Stern comme nécessitant quatre sessions de soins périodontaux coûtant des milliers ; plusieurs dentistes qui regardaient les mêmes images étaient en désaccord. Pearl AI et Overjet sont les fournisseurs nommés, les deux des incumbents bien-financés dans l'espace de l'AI radiographique dentaire. Le pitch marketing de Pearl aux dentistes, cité dans le writeup de Futurism : les pratiques qui l'utilisent trouvent « 37 pour cent plus de maladies et livrent 24 pour cent plus de soins aux patients ».

La claim marketing est la partie architecturalement intéressante, séparée de l'expérience d'un patient en particulier. Un produit AI vendu à son opérateur sur l'uplift de revenu — « tu factureras plus après nous avoir déployés » — est qualitativement différent d'un produit vendu sur l'amélioration d'exactitude — « tes diagnostics seront plus corrects ». Le pitch de Pearl combine les deux : le 37% sort comme claim d'amélioration de détection, le 24% comme conséquence de facturation. Si les données de déploiement supportent le chiffre de détection sur des cohortes de patients out-of-sample comparées contre consensus d'experts, la facturation suit. Si le chiffre de détection est de la dérive de calibration vers les faux positifs, la facturation est iatrogène. L'article ne surface pas d'études de validation publiées, de lectures comparatives grade-clearance FDA, ou de données d'audit tierces qui permettraient à un observateur extérieur de dire laquelle des deux.

Mets ça contre l'audit du vérificateur général de l'Ontario de ce matin : 20 sur 20 fournisseurs d'AI scribes ont montré des inexactitudes pendant le testing d'approvisionnement. Deux domaines, deux modes de défaillance — fabrication de notes du côté scribe, inflation diagnostique possible du côté imagerie — mais la même gap sous-jacente : le déploiement dépasse l'évaluation tierce. Les fournisseurs d'AI dentaire ne font pas encore face au genre de scrutin d'audit provincial que l'Ontario a appliqué aux scribes ; le marché dentaire US est dominé par les payeurs privés, ce qui change le leverage du régulateur. Watch la FDA, les conseils dentaires d'État, et les principaux assureurs dentaires comme les corps qui pourraient publier leurs propres études comparatives une fois qu'assez d'anecdotes grade-Stern s'accumulent.

Lundi matin : si tu bâtis ou vends de l'AI clinique, la ligne entre « améliore la détection » et « augmente les procédures facturables » est la ligne que ton copy marketing devrait pas brouiller, peu importe comment le marché dentaire récompense actuellement le brouillage. Si t'es un dentiste qui déploie ces outils, la question grade-audit, c'est pas quel est le chiffre d'amélioration revendiqué par le fournisseur — c'est si un dentiste humain second-reader est d'accord avec les flags de l'AI à un taux qui dépasse l'accord inter-rater entre humains sur les mêmes images sans AI. C'est ça le harness ; le fournisseur a la data ou il l'a pas. Si tu choisis quels segments d'AI clinique attaquer, l'absence de données de validation publique dans l'imagerie dentaire, c'est soit une opportunité (sois le fournisseur qui les publie), soit un avertissement (le segment va se faire repricer quand quelqu'un d'autre le fera).