La mise à jour Codex d'OpenAI vise directement Claude Code avec des agents parallèles pis 3x moins de tokens, mais les évals aveugles donnent encore la victoire à Claude

OpenAI a livré en avril une mise à jour Codex cadrée dans la couverture comme un coup direct vers Claude Code d'Anthropic, pis le cadrage est juste. Le refresh apporte trois changements concrets. Le modèle par défaut est GPT-5.4 depuis le 5 mars, avec 1 million de tokens de contexte pis de la recherche d'outils améliorée à travers de gros codebases. Codex peut maintenant rouler plusieurs agents concurrents sur un même projet, chacun dans un git worktree isolé, ce qui est le patron que Claude Code a popularisé. Pis la mise à jour sort dans le cadre de la nouvelle superapp bureau unifiée d'OpenAI qui combine ChatGPT, Codex pis le navigateur Atlas dans un seul environnement. La cible est claire : matcher le workflow de Claude Code, le battre sur le coût pis la vitesse, pis rendre l'écosystème OpenAI assez collant pour que les acheteurs arrêtent de comparer.

Deux chiffres comptent pour quiconque choisit vraiment entre les deux outils. Dans des évaluations aveugles de qualité de code au début 2026, Claude Code a gagné 67 pour cent du temps contre Codex CLI sur des tâches équivalentes. Sur les mêmes tâches, Codex a utilisé à peu près 3x moins de tokens. Les deux sont réels, pis ils se contredisent pas. L'avantage de Claude Code se concentre dans le raisonnement multi-étapes à long contexte, là où sa fenêtre de 1M tokens est vraiment utilisée pis où l'agent doit tenir un gros plan dans le contexte de travail. L'avantage de Codex se concentre dans les tâches bien bornées qui se parallélisent, là où l'efficacité en tokens compose à travers l'éventail. La capacité d'agents parallèles dans des git worktrees, c'est la vraie nouvelle fonctionnalité à évaluer. Ça change le modèle mental de « un agent, sérialisé » à « dispatche dix agents, révise les dix PRs ». Ce workflow est puissant pour certains types de travail (vagues de correctifs de bogues, bumps de dépendances, refactors à travers plusieurs fichiers) pis inutile pour d'autres (développement d'une fonctionnalité unique où le surcoût de coordination noie le gain de parallélisme).

La compétition d'outils a mûri au-delà de la parité de fonctionnalités vers un vrai positionnement. Claude Code est le défaut pour le raisonnement multi-étapes complexe, l'opération à long contexte, les équipes qui tiennent à la confidentialité de l'exécution locale, pis quiconque vit dans un terminal. Codex est le défaut pour la délégation de tâches asynchrones pis parallèles, les opérations sensibles au coût à volume, pis les équipes déjà enracinées dans l'écosystème OpenAI. Ce sont des paris produit différents, pis les deux sont légitimes. Les constructeurs qui choisissent entre les deux devraient arrêter de chercher une seule réponse pis commencer à router les tâches selon leur forme. Le troisième joueur à suivre, c'est Cursor, qui glisse dans un rôle de harnais multi-modèles neutre : la couche d'interface qui laisse les équipes utiliser Claude pour le raisonnement profond, Codex pour le dispatch parallèle, pis un modèle local pour du code sensible, sans re-outiller à chaque fois. Si Cursor fait cette couche-là comme il faut, le choix de modèle devient une décision de configuration plutôt qu'une décision de plateforme.

Pour quiconque roule un agent de code aujourd'hui, trois gestes suivent. Premièrement, instrumente le coût en tokens par tâche, pas juste le taux de succès. La plupart des équipes savent pas si elles paient 3x ce qu'elles devraient, parce que le chiffre de tokens est rarement mis en avant dans le workflow quotidien. Deuxièmement, audite quelles de tes tâches de code bénéficient vraiment d'agents parallèles. Si ta réponse c'est « toutes », t'as pas pensé au surcoût de coordination honnêtement ; si ta réponse c'est « aucune », tu te trompes probablement sur ton travail de correctifs pis de dépendances. Troisièmement, garde ton harnais d'agents indépendant du modèle. Claude Opus 4.7 est sorti aujourd'hui, GPT-5.4 a six semaines, pis la prochaine itération est toujours à quelques semaines de distance. Peu importe quel outil gagne en avril 2026, c'est pas nécessairement celui que tu veux d'ici le Q3, pis réécrire tes boucles d'agents à chaque trimestre, c'est pas une posture soutenable.

La mise à jour Codex d'OpenAI vise directement Claude Code avec des agents parallèles pis 3x moins de tokens, mais les évals aveugles donnent encore la victoire à Claude

Plus de nouvelles