IA générative

GPT-5.3-Codex : le premier modèle d'OpenAI qui a participé à sa propre création

5 févr. 2026 3 min de lecture Paul Forcadel
GPT-5.3-Codex : le premier modèle d'OpenAI qui a participé à sa propre création

Un modèle qui s'est construit lui-même

OpenAI a lancé GPT-5.3-Codex le 5 février 2026. Le modèle combine les capacités de codage de GPT-5.2-Codex avec le raisonnement de GPT-5.2, le tout 25 % plus rapide et avec moins de tokens consommés.

Le fait marquant : c'est le premier modèle d'OpenAI qui a été « instrumental dans sa propre création ». L'équipe Codex a utilisé des versions préliminaires pour débugger l'entraînement, gérer le déploiement et diagnostiquer les résultats de tests. Le modèle a participé à sa propre naissance.

Les benchmarks

Les gains les plus spectaculaires ne sont pas sur le code pur, mais sur les tâches autonomes :

Benchmark GPT-5.3-Codex GPT-5.2-Codex Progression
SWE-Bench Pro 56,8 % 56,4 % +0,4 pt
Terminal-Bench 2.0 77,3 % 64,0 % +13,3 pts
OSWorld-Verified 64,7 % 38,2 % +26,5 pts
Cybersecurity CTF 77,6 % 67,4 % +10,2 pts
SWE-Lancer IC Diamond 81,4 % 76,0 % +5,4 pts

Sur OSWorld (tâches de bureau via vision par ordinateur), le modèle approche la moyenne humaine de 72 %. Sur Terminal-Bench, le bond de 13 points montre une maîtrise nettement améliorée de l'exécution de commandes en environnement réel.

Plus qu'un copilote de code

GPT-5.3-Codex ne se limite plus à la complétion de code. Il gère le débugage, le déploiement, la documentation, les présentations, les tableurs et la recherche. Il maintient des sessions de plusieurs heures ou jours sans perte de contexte, traitant des millions de tokens. On peut interagir avec lui pendant qu'il travaille — ajuster la direction, discuter des choix — sans casser son fil de pensée.

Améliorations concrètes : moins de boucles de linting stériles, meilleure analyse de bugs avec preuves à l'appui, moins de conclusions prématurées sur les tests intermittents.

Premier modèle classé « High risk » en cybersécurité

C'est aussi le premier modèle qu'OpenAI classe « High capability » en cybersécurité dans son Preparedness Framework. Le score de 77,6 % sur les CTF de cybersécurité a déclenché des mesures inédites : pas d'accès API immédiat, monitoring automatisé renforcé, et un programme pilote « Trusted Access for Cyber » réservé aux chercheurs en sécurité défensive.

Sam Altman a reconnu que le modèle pourrait « permettre de manière significative des dommages cyber réels », tout en précisant qu'OpenAI n'a pas de preuve qu'il puisse automatiser complètement une cyberattaque. L'approche est précautionneuse : 10 millions de dollars de crédits API sont alloués aux développeurs travaillant sur la défense cyber.

Disponibilité

GPT-5.3-Codex est disponible pour les abonnés ChatGPT payants via l'application, le CLI, les extensions IDE et le web. L'accès API arrivera « dans les semaines à venir » une fois la stack de sécurité finalisée. Le modèle tourne sur des systèmes NVIDIA GB200 NVL72.

Partager cet article

Sources

Références et articles originaux

Rédigé par

Paul Forcadel

Paul Forcadel

Fondateur & Rédacteur en chef

Passionné d'IA et de technologies émergentes, Paul décrypte les dernières avancées en intelligence artificielle pour les rendre accessibles à tous.

Parcourir par catégorie

Newsletter

Recevez les actus IA directement dans votre boîte mail.

Suivez-nous

Retrouvez-nous sur les réseaux pour ne rien rater.