Aller au contenu principal

GPT-5.4 : le premier modèle à battre l'humain en computer use

5 mars 2026 2 min de lecture Paul Forcadel
GPT-5.4 : le premier modèle à battre l'humain en computer use

Le computer use devient natif

OpenAI a lancé le 5 mars 2026 GPT-5.4, son modèle le plus performant, avec une capacité inédite : le computer use natif. Le modèle peut interagir directement avec un bureau ou un navigateur via des captures d'écran, des clics souris et des frappes clavier — sans que l'utilisateur ait à décomposer chaque étape.

Concrètement, GPT-5.4 observe visuellement l'écran, navigue, remplit des formulaires, exécute des scripts et manipule des applications. Il peut aussi écrire du code via des bibliothèques comme Playwright pour automatiser des tâches complexes.

75 % sur OSWorld : au-dessus de l'humain

Sur le benchmark OSWorld-Verified, qui mesure la capacité d'un modèle à naviguer un environnement de bureau, GPT-5.4 atteint 75,0 % — dépassant le score humain de référence à 72,4 %. Le bond est spectaculaire : GPT-5.2 plafonnait à 47,3 %.

C'est la première fois qu'un modèle IA surpasse les performances humaines sur ce type de tâche, marquant un tournant pour l'automatisation de bureau.

Des benchmarks records sur toute la ligne

GPT-5.4 domine sur plusieurs axes :

  • GDPval : 83 % (vs 70,9 % pour GPT-5.2) — le modèle égale ou surpasse des professionnels dans 44 métiers
  • SWE-Bench Pro : 57,7 % en résolution de bugs logiciels
  • ARC-AGI-2 : 73,3 % (83,3 % en version Pro)
  • FrontierMath Tier 4 : 27,1 % (38 % en Pro)
  • APEX-Agents : performances record en droit et finance

Le modèle est aussi 33 % moins susceptible de produire des erreurs factuelles par rapport à GPT-5.2.

Deux variantes et un outil de recherche

OpenAI décline GPT-5.4 en deux versions : Thinking (raisonnement avancé, accessible aux abonnés Plus, Team, Pro) et Pro (performances maximales, réservé aux plans Pro et Enterprise).

Le nouveau système de tool search réduit la consommation de tokens de 47 % tout en maintenant la précision, en sélectionnant automatiquement les outils les plus pertinents pour chaque tâche.

Côté API, GPT-5.4 est proposé à 2,50 $/M tokens en entrée et 15 $/M en sortie, avec un contexte de 1 million de tokens dans Codex (272 000 en standard). La version Pro monte à 30 $/M en entrée et 180 $/M en sortie.

Partager cet article

Questions fréquentes

GPT-5.4 peut interagir directement avec un bureau via des captures d'écran, clics et frappes clavier. Il navigue, remplit des formulaires et exécute des scripts sans intervention humaine.
Sur le benchmark OSWorld-Verified de navigation de bureau, oui : GPT-5.4 atteint 75 % contre 72,4 % pour les humains. C'est une première pour un modèle IA.
Thinking est la version standard pour le raisonnement avancé, accessible à tous les abonnés payants. Pro offre des performances maximales mais coûte 12× plus cher en API et est réservé aux plans Pro et Enterprise.
GPT-5.4 standard : 2,50 $ par million de tokens en entrée, 15 $ en sortie. Version Pro : 30 $ en entrée, 180 $ en sortie. Contexte de 1 million de tokens disponible dans Codex.

Sources

Références et articles originaux

Rédigé par

Paul Forcadel

Paul Forcadel

Fondateur & Rédacteur en chef

Passionné d'IA et de technologies émergentes, Paul décrypte les dernières avancées en intelligence artificielle pour les rendre accessibles à tous.

Articles connexes

Parcourir par catégorie