GPT-5.4 — Thinking
ProgrammationUn modèle frontière généraliste qui bat par hasard les spécialistes de la programmation aux benchmarks qui comptent le plus. Imaginez un décathlonien qui détient aussi le record du monde du 100 mètres.
SWE-Bench Pro 57,7 % — un généraliste bat GPT-5.3-Codex (56,8 %). Contexte de 1M tokens pour charger des dépôts entiers. 47 % d'économie de tokens grâce aux outils natifs. 1,5x plus rapide dans Codex.
Coûts d'API plus élevés (2,50 $/M entrée, 15 $/M sortie). Contexte complet au tarif double dans Codex. Opus 4.6 produit encore du code plus cohérent architecturalement dans les refactorisations massives.