Le computer use devient natif
OpenAI a lancé le 5 mars 2026 GPT-5.4, son modèle le plus performant, avec une capacité inédite : le computer use natif. Le modèle peut interagir directement avec un bureau ou un navigateur via des captures d'écran, des clics souris et des frappes clavier — sans que l'utilisateur ait à décomposer chaque étape.
Concrètement, GPT-5.4 observe visuellement l'écran, navigue, remplit des formulaires, exécute des scripts et manipule des applications. Il peut aussi écrire du code via des bibliothèques comme Playwright pour automatiser des tâches complexes.
75 % sur OSWorld : au-dessus de l'humain
Sur le benchmark OSWorld-Verified, qui mesure la capacité d'un modèle à naviguer un environnement de bureau, GPT-5.4 atteint 75,0 % — dépassant le score humain de référence à 72,4 %. Le bond est spectaculaire : GPT-5.2 plafonnait à 47,3 %.
C'est la première fois qu'un modèle IA surpasse les performances humaines sur ce type de tâche, marquant un tournant pour l'automatisation de bureau.
Des benchmarks records sur toute la ligne
GPT-5.4 domine sur plusieurs axes :
- GDPval : 83 % (vs 70,9 % pour GPT-5.2) — le modèle égale ou surpasse des professionnels dans 44 métiers
- SWE-Bench Pro : 57,7 % en résolution de bugs logiciels
- ARC-AGI-2 : 73,3 % (83,3 % en version Pro)
- FrontierMath Tier 4 : 27,1 % (38 % en Pro)
- APEX-Agents : performances record en droit et finance
Le modèle est aussi 33 % moins susceptible de produire des erreurs factuelles par rapport à GPT-5.2.
Deux variantes et un outil de recherche
OpenAI décline GPT-5.4 en deux versions : Thinking (raisonnement avancé, accessible aux abonnés Plus, Team, Pro) et Pro (performances maximales, réservé aux plans Pro et Enterprise).
Le nouveau système de tool search réduit la consommation de tokens de 47 % tout en maintenant la précision, en sélectionnant automatiquement les outils les plus pertinents pour chaque tâche.
Côté API, GPT-5.4 est proposé à 2,50 $/M tokens en entrée et 15 $/M en sortie, avec un contexte de 1 million de tokens dans Codex (272 000 en standard). La version Pro monte à 30 $/M en entrée et 180 $/M en sortie.