GPT‑5.5

OpenAI · Publié April 23, 2026

9.9 /10 Note globale

Ce que c'est réellement

Si l’histoire de l’IA était un groupe de rock, ChatGPT serait les Beatles — pas nécessairement le plus sophistiqué techniquement à chaque instant, mais celui qui a changé ce que tout le monde attendait de la musique. GPT-5.5 est l’album où le groupe arrête de jouer des reprises et commence à composer des symphonies. Il ne se contente pas de répondre aux questions — il planifie, exécute, utilise des outils, vérifie son propre travail et continue jusqu’à ce que la tâche soit véritablement terminée.

Imaginez une mise à niveau d’un assistant très intelligent vers un collègue très intelligent qui n’oublie jamais un brief. GPT-5.5 planifie des problèmes en plusieurs étapes, utilise des outils de manière autonome, opère votre ordinateur quand nécessaire et exécute des workflows qui nécessitaient auparavant plusieurs modèles et une orchestration manuelle. Il lit, écrit, génère des images, navigue sur le web, exécute du code — et fait tout cela avec 40 % de tokens en moins. Comme l’a dit Ethan Mollick : « Il construit exactement ce que je demande. »

Points Forts

GDPval 84,9 % sur 44 professions : Analyse juridique, modélisation financière, support client, science des données — GPT-5.5 dépasse les 83,0 % de GPT-5.4 et les 80,3 % d’Opus 4.7. Cela mesure si le modèle aide véritablement les professionnels à terminer leur travail.
Exécution agentique qui fonctionne : Planifie des tâches en plusieurs étapes, utilise des outils de manière autonome, vérifie sa propre sortie et continue jusqu’à ce que le travail soit fait. OSWorld-Verified 78,7 % (contre 75,0 %) — il navigue sur votre bureau mieux que la plupart des stagiaires.
40 % de tokens de sortie en moins : Même latence que GPT-5.4, mais il s’exprime plus efficacement. Le coût réel par tâche baisse malgré le prix par token doublé — le calcul est favorable pour les utilisateurs intensifs.
Tau2-Bench Telecom 98,0 % : Workflows complexes d’agent de service client complétés quasi parfaitement. Le benchmark qui prouve que l’étiquette « agent » n’est pas du marketing.
Étendue de l’écosystème : Disponible sur web, iOS, Android, applications de bureau et via API. GPTs personnalisés, intégration Codex, mémoire persistante, Canvas, génération d’images — tout ce que vous utilisez déjà, désormais propulsé par un cerveau qui va au bout.

Aperçu des Benchmarks

GDPval — 84,9 % Performance professionnelle réelle sur 44 professions. Dépasse GPT-5.4 (83,0 %), Opus 4.7 (80,3 %) et Gemini 3.1 Pro (67,3 %) de manière décisive.
Artificial Analysis — #1 Score d'Indice d'Intelligence de 60 — 3 points devant l'ancien triple ex-æquo. Le benchmark composite indépendant le plus large.
OSWorld-Verified — 78,7 % Benchmark d'utilisation informatique où le modèle opère des applications de bureau de manière autonome. En hausse par rapport aux 75,0 % de GPT-5.4.
Tau2-Bench — 98,0 % Workflows complexes d'agent de service client complétés quasi parfaitement. Prouve la capacité agentique dans les tâches métier structurées.

Limites Honnêtes

Hausse de prix : Les coûts d’API doublent à 5 $/M en entrée et 30 $/M en sortie. Le niveau Pro est encore plus élevé. L’efficacité de 40 % sur les tokens compense pour les utilisateurs intensifs, mais les utilisateurs occasionnels ressentiront la facture.
Prudence sur les hallucinations : Un rapport indépendant précoce a signalé des taux d’hallucination plus élevés sur certaines évaluations. OpenAI revendique un meilleur jugement via le raisonnement, mais traitez le travail critique (juridique, médical, financier) avec des couches de vérification.
API pas encore disponible : Au lancement, GPT-5.5 est dans ChatGPT et Codex mais l’API arrive « très bientôt ». Si vous construisez sur l’API, vous attendez.
Garde-fous renforcés : Le système de sécurité le plus strict qu’OpenAI ait livré. La plupart des utilisateurs ne le remarqueront pas, mais les utilisateurs avancés dans les cas limites rencontreront des refus occasionnels.

Le Verdict: L’ère agentique tient son champion le plus clair. GPT-5.5 ne se contente pas d’itérer sur GPT-5.4 — il redéfinit ce que signifie « suffisamment bon pour livrer du travail ». Le leadership en GDPval, le #1 en Artificial Analysis et la quasi-perfection en Tau2-Bench en font l’IA du quotidien qui mérite enfin le mot « collègue ». Il coûte plus par token — mais accomplit plus de travail par euro. Si vous ne vous abonnez qu’à une seule IA en 2026, c’est celle qui mène le travail complexe et ambigu à terme avec un minimum de supervision.