Qu'est-ce que le computer use natif de GPT-5.4 ?

GPT-5.4 peut interagir directement avec un bureau via des captures d'écran, clics et frappes clavier. Il navigue, remplit des formulaires et exécute des scripts sans intervention humaine.

GPT-5.4 est-il vraiment meilleur qu'un humain ?

Sur le benchmark OSWorld-Verified de navigation de bureau, oui : GPT-5.4 atteint 75 % contre 72,4 % pour les humains. C'est une première pour un modèle IA.

Quelle est la différence entre GPT-5.4 Thinking et Pro ?

Thinking est la version standard pour le raisonnement avancé, accessible à tous les abonnés payants. Pro offre des performances maximales mais coûte 12× plus cher en API et est réservé aux plans Pro et Enterprise.

Combien coûte GPT-5.4 en API ?

GPT-5.4 standard : 2,50 $ par million de tokens en entrée, 15 $ en sortie. Version Pro : 30 $ en entrée, 180 $ en sortie. Contexte de 1 million de tokens disponible dans Codex.

GPT-5.4 : le premier modèle à battre l'humain en computer use

5 mars 2026 2 min de lecture Paul Forcadel

Le computer use devient natif

OpenAI a lancé le 5 mars 2026 GPT-5.4, son modèle le plus performant, avec une capacité inédite : le computer use natif. Le modèle peut interagir directement avec un bureau ou un navigateur via des captures d'écran, des clics souris et des frappes clavier — sans que l'utilisateur ait à décomposer chaque étape.

Concrètement, GPT-5.4 observe visuellement l'écran, navigue, remplit des formulaires, exécute des scripts et manipule des applications. Il peut aussi écrire du code via des bibliothèques comme Playwright pour automatiser des tâches complexes.

75 % sur OSWorld : au-dessus de l'humain

Sur le benchmark OSWorld-Verified, qui mesure la capacité d'un modèle à naviguer un environnement de bureau, GPT-5.4 atteint 75,0 % — dépassant le score humain de référence à 72,4 %. Le bond est spectaculaire : GPT-5.2 plafonnait à 47,3 %.

C'est la première fois qu'un modèle IA surpasse les performances humaines sur ce type de tâche, marquant un tournant pour l'automatisation de bureau.

Des benchmarks records sur toute la ligne

GPT-5.4 domine sur plusieurs axes :

GDPval : 83 % (vs 70,9 % pour GPT-5.2) — le modèle égale ou surpasse des professionnels dans 44 métiers
SWE-Bench Pro : 57,7 % en résolution de bugs logiciels
ARC-AGI-2 : 73,3 % (83,3 % en version Pro)
FrontierMath Tier 4 : 27,1 % (38 % en Pro)
APEX-Agents : performances record en droit et finance

Le modèle est aussi 33 % moins susceptible de produire des erreurs factuelles par rapport à GPT-5.2.

Deux variantes et un outil de recherche

OpenAI décline GPT-5.4 en deux versions : Thinking (raisonnement avancé, accessible aux abonnés Plus, Team, Pro) et Pro (performances maximales, réservé aux plans Pro et Enterprise).

Le nouveau système de tool search réduit la consommation de tokens de 47 % tout en maintenant la précision, en sélectionnant automatiquement les outils les plus pertinents pour chaque tâche.

Côté API, GPT-5.4 est proposé à 2,50 $/M tokens en entrée et 15 $/M en sortie, avec un contexte de 1 million de tokens dans Codex (272 000 en standard). La version Pro monte à 30 $/M en entrée et 180 $/M en sortie.