Filtre Tous Écosystème Quotidien Génération d'Images Programmation Créateurs d'Applications Recherche Architectes Numériques Mentors Académiques Vidéo Musique et Voix IA Locale / Privée Agents IA

Claude — Opus 4.8

Anthropic · Publié May 28, 2026

9.9 /10 Note globale
Site officiel

Ce que c'est réellement

Si ChatGPT est l’extraverti à la fête et Gemini celui qui lit dans son coin, Claude Opus 4.8 est la personne calme et articulée qui écoute vraiment ce que vous dites — et qui maintenant vous dit aussi honnêtement quand elle n’est pas sûre de quelque chose. Cette deuxième partie est nouvelle, et elle compte plus que n’importe quel chiffre de benchmark.

Le dernier vaisseau amiral d’Anthropic ne se contente pas de traiter l’information — il la traite avec intégrité. Opus 4.8 est 4× moins susceptible de fabriquer un « J’ai fini » confiant quand ce n’est pas le cas. Il signale les incertitudes de manière proactive. Il conteste les mauvaises hypothèses au lieu de les exécuter joyeusement. Dans un monde où chaque modèle d’IA prétend être le meilleur, celui-ci a la distinction inhabituelle d’être prêt à admettre quand il n’est pas sûr.

Les améliorations techniques sont réelles aussi. Les Dynamic Workflows permettent à un agent Opus leader de déployer des centaines de sous-agents parallèles — l’un analysant les finances, un autre vérifiant les clauses juridiques, un troisième rédigeant le résumé, le tout avec du checkpointing pour que rien ne se perde. Le contrôle de l’effort signifie que vous choisissez enfin la profondeur : réponse rapide, analyse approfondie ou recherche en profondeur. Et la fenêtre de contexte d'1M de tokens ne fait pas que retenir vos documents — elle raisonne dessus sans les problèmes de « perdu au milieu » qui sont apparus avec 4.7.

Le hic ? Toujours le même. Vous payez pour cette qualité. Alors que le niveau gratuit de ChatGPT est généreux et que Gemini est inclus dans votre abonnement Google, le niveau gratuit de Claude est limité. La vraie expérience Opus commence à 20 $/mois et monte jusqu’à 200 $/mois. Mais pour les professionnels facturant à l’heure et ayant besoin de réponses auxquelles ils peuvent vraiment faire confiance — le calcul n’a pas changé. Il reste simple.

Points Forts

  • Honnêteté véritablement mesurable : Opus 4.8 est 4× moins susceptible de fabriquer des affirmations d’achèvement. Il signale les incertitudes de manière proactive, conteste les mauvaises hypothèses et dit « Je ne sais pas » quand c’est la réponse honnête. Ce n’est pas un argument marketing — c’est le plus grand bond qualitatif par rapport à 4.6 et 4.7.
  • Fenêtre de contexte d'1M de tokens : 750 000 mots — dix romans, une base de code complète ou les notes d’un semestre entier — dans une seule conversation. Et contrairement à 4.7, la qualité du contexte ne se dégrade pas notablement dans les plages intermédiaires.
  • Dynamic Workflows : Un agent Opus leader déploie et gère des centaines de sous-agents parallèles pour des tâches massives — ratissages de recherche, analyse de documents, revues de code. Gestion de projet IA avec checkpointing pour les workflows de longue durée.
  • Contrôle de l’effort : Choisissez Default (réponses rapides), Extra (analyse approfondie) ou Max (recherche en profondeur). Fini le raisonnement taille unique. Le mode rapide offre 2,5× la vitesse à 3× moins cher pour les tâches légères.
  • Fiabilité agentique de premier ordre : 100% de complétion sur Super-Agent. 83,4% sur Online-Mind2Web (agent navigateur). Premier modèle à franchir 10% en all-pass au Legal Agent Benchmark. Quand vous lui confiez une tâche complexe et partez, il la termine vraiment.
Aperçu des Benchmarks
  • Knowledge Work — 1 890 (contre 1 753) Benchmark interne mesurant l'analyse professionnelle, la synthèse et la qualité rédactionnelle. Une amélioration de 7,8% par rapport à Opus 4.7 — le genre de gain qui se ressent dans le travail quotidien.
  • Online-Mind2Web — 83,4% (agent navigateur n°1) Tâches d'agent basées sur le navigateur. Opus 4.8 bat à la fois Opus 4.7 (82,8%) et GPT-5.5. Le modèle d'utilisation d'ordinateur et d'agent navigateur le plus performant testé.
  • Legal Agent Benchmark — premier à franchir 10% Travail juridique substantiel au standard all-pass. Le gain de précision se traduit directement par la quantité de travail d'avocat réel que les clients peuvent déléguer en confiance.

Limites Honnêtes

  • Tarifs premium : Pro à 20 $/mois, Max à 100–200 $/mois. API : 5 $ entrée / 25 $ sortie par million de tokens. Le cache de prompts aide (jusqu’à 90 % de réduction), mais l’usage intensif s’accumule vite.
  • Pas de génération d’images native : Contrairement à ChatGPT et Gemini, Claude ne peut pas créer d’images. Il les analyse brillamment, mais pour une image, il faut un autre outil.
  • Écosystème plus restreint : Moins d’intégrations, pas de boutique de plugins et un niveau gratuit plus limité que ChatGPT. Claude dans Microsoft 365 s’étend mais n’est pas encore universel.
  • Consommation de tokens sur les tâches profondes : La réflexion plus approfondie qui rend Opus 4.8 plus fiable signifie aussi plus de tokens par conversation sur le travail complexe. Le mode rapide atténue cela pour les tâches simples, mais attendez-vous à des coûts plus élevés sur les sessions de recherche intensives.

Le Verdict: Si Opus 4.6 était le professionnel discret sur lequel vous vous fixez, Opus 4.8 est ce même professionnel après une promotion. Tout ce qui a fait de Claude le choix des experts est toujours là — la compréhension de lecture, la qualité rédactionnelle, le contexte d’un million de tokens. Mais maintenant il est aussi honnête sur ce qu’il ne sait pas, plus aiguisé dans son jugement et capable de mener de longs workflows autonomes sans vérifications constantes. Le hic est inchangé : vous payez premium pour une qualité premium. Mais pour quiconque dont le travail implique de longs documents, une analyse minutieuse ou des décisions qui comptent vraiment — c’est le modèle qui travaille le mieux quand le travail compte le plus.