Claude Opus 4.6

By Anthropic · Updated

Ce que c'est réellement

Opus 4.6 est le modèle le plus grand et le plus capable d’Anthropic — celui qu’ils sortent quand le problème est trop complexe pour Sonnet. Si Sonnet 4.6 est le collègue intelligent qui écrit du code propre, Opus est l’ingénieur principal qui repense l’architecture. Il ne se contente pas de compléter votre fonction — il comprend pourquoi la fonction existe, comment elle est liée au reste du code, et en quoi elle devrait probablement être refactorisée. L’approche « réfléchir avant de coder » est bien réelle. Opus planifie des refactorisations en plusieurs étapes, maintient le contexte sur des bases de code étendues et produit du code qui ressemble à celui d’un ingénieur senior l’ayant relu. Anthropic l’a spécifiquement optimisé pour les workflows agentiques — le genre où vous dites « implémente cette fonctionnalité » et il planifie, écrit, teste et itère sur plusieurs fichiers sans perdre le fil.

Points Forts

Fenêtre de contexte de 1M de tokens (bêta) : Environ 750 000 mots de code et de documentation dans une seule session. Vous pouvez charger un monorepo entier et poser des questions à travers l’ensemble.
Champion du codage agentique : Notes maximales sur les benchmarks de codage agentique — il planifie, exécute et s’autocorrige sur de longues tâches sans perdre la cohérence.
Qualité du code : Produit de manière cohérente du code bien structuré et idiomatique. Il suit les patterns déjà présents dans votre base de code plutôt que d’imposer ses propres conventions.
Raisonnement multi-fichiers : Opus comprend comment les modifications d’un fichier se propagent dans tout un projet. Il met à jour les tests, les types et les interfaces lorsqu’il modifie les implémentations.
Réflexion étendue : Pour les décisions architecturales difficiles, le mode de réflexion lui permet de peser les compromis avant de s’engager dans un design.

Aperçu des Benchmarks

Arena Elo — 1 561 (n°1 Code)Comparaisons crowdsourcées en aveugle sur le classement Code d'arena.ai. Opus 4.6 détient la 1re place sur 45 modèles — bien devant GPT-5.2 (n°5).
SWE-bench Verified — 79,2 %Issues GitHub réelles provenant de dépôts en production. Opus 4.6 avec le mode Thinking est en tête du classement SWE-bench.
Arena Elo — 1 505 (n°1 Texte)Détient également la 1re place sur le classement général Text Arena — pas seulement un spécialiste du code mais le modèle le mieux noté toutes catégories.

Limites Honnêtes

Coût : Le modèle le plus cher de sa catégorie. Une longue session agentique parcourant une base de code peut coûter nettement plus que les équivalents Sonnet ou GPT.
Vitesse : Plus lent que les modèles plus légers. Si vous avez besoin d’un simple one-liner ou d’une signature de fonction, Opus est surdimensionné — comme embaucher un chirurgien pour poser un pansement.
Amplification des coûts agentiques : Les longues sessions autonomes peuvent déraper si vous ne supervisez pas. Définissez des points de contrôle et vérifiez ce qu’il a modifié.

Le Verdict: Le meilleur partenaire IA pour la programmation que l’argent puisse acheter — et ça coûte réellement de l’argent. Utilisez Opus 4.6 pour les refactorisations complexes, l’implémentation de fonctionnalités à grande échelle et les décisions architecturales. Utilisez Sonnet pour tout le reste. La distinction est réelle, la différence de coût est significative, et adapter le modèle à la tâche est la moitié du savoir-faire.