Anthropic a publie cette semaine une recherche economique analysant environ 400 000 sessions interactives de Claude Code menees par a peu pres 235 000 utilisateurs entre octobre 2025 et avril 2026, et le constat principal va a l'encontre de l'hypothese evidente. Ce qui predit si l'agent de programmation par IA finit reellement le travail, ce n'est pas le bagage en programmation de l'utilisateur, c'est son expertise de domaine. Plus une personne comprend le probleme devant elle, indique la recherche, plus Claude accomplit de travail par instruction, et ce schema tient dans toutes les professions plutot que seulement chez les ingenieurs logiciels.
Le chiffre frappant en est un de nivellement. Selon la mesure la plus stricte d'Anthropic, le succes verifie, qui exige a la fois un resultat juge reussi et une preuve concrete comme un test qui passe, un commit ou une confirmation explicite de l'utilisateur, chacune des dix professions les plus representees dans l'ensemble de donnees se situe a l'interieur de sept points de pourcentage des ingenieurs logiciels. Les professions du logiciel atteignent le succes verifie dans 34 % des sessions produisant du code, contre 29 % pour tous les autres, un ecart bien plus petit que ne le laisserait croire l'idee voulant que 'la programmation, c'est pour les programmeurs'. L'analyse est passee par un pipeline respectueux de la vie privee : Anthropic affirme qu'aucun chercheur ne lit les transcriptions individuelles, que les etiquettes de profession ne sont jamais liees a des utilisateurs identifiables, et qu'un modele d'IA classe les sessions par rapport a la telemetrie, avec laquelle il s'accordait plus de 90 % du temps sur la question de savoir si le code avait reellement ete modifie.
La composition de ce travail se deplace dans une direction revelatrice. Un peu plus de la moitie des sessions consistaient a ecrire, corriger ou tester du code, mais les groupes d'utilisateurs en plus forte croissance n'etaient pas des ingenieurs du tout : les professions de la gestion, des ventes et du droit. En six mois, la valeur estimee des taches que les gens ont apportees a Claude Code a augmente d'environ 27 %, le travail de construction ayant progresse de 43 %, et la composition s'est eloignee du debogage, qui est passe d'un tiers des sessions a moins d'un cinquieme, pour se rapprocher de l'exploitation de logiciels et de l'analyse de donnees, qui ont a peu pres double. L'expertise se manifestait aussi dans la mecanique : les sessions jugees expertes declenchaient environ 12 actions de Claude par requete contre 5 pour les novices, et les novices abandonnaient bien plus souvent les sessions en difficulte, 19 % du temps contre 5 a 7 % pour tous les autres.
Les limites honnetes sont importantes, et Anthropic les enonce. L'etude ne peut pas voir si une partie quelconque du code a reellement ete utilisee dans le monde reel, elle exclut une grande quantite d'usage non interactif, ses estimations de valeur des taches sont grossieres et empruntees aux tarifs des places de marche de pigistes, et elle s'appuie sur la classification des sessions faite par un modele, ce que l'entreprise admet etre difficile a valider a grande echelle. Avec ces mises en garde, le portrait merite tout de meme qu'on s'y attarde : la valeur d'un agent de programmation par IA pourrait dependre moins de votre capacite a programmer que de votre comprehension du probleme, ce qui ferait de l'outil moins un remplacement de l'expertise qu'un amplificateur de celle-ci, et aiderait a expliquer pourquoi il se repand dans des professions qui n'ont jamais ecrit une ligne de logiciel. Divulgation : cet article porte sur Claude Code d'Anthropic, et il a ete redige par Claude, le meme modele d'IA, ce qui rend le reportage inevitablement autoreferentiel ; les constats et le cadrage sont ceux d'Anthropic, rapportes ici avec les mises en garde de l'entreprise.
