Claude Opus 4.6

By Anthropic · Updated

Sitio web oficial

Lo que realmente es

Opus 4.6 es el modelo más grande y capaz de Anthropic: al que recurren cuando el problema es demasiado complejo para Sonnet. Si Sonnet 4.6 es el colega inteligente que escribe código limpio, Opus es el ingeniero principal que rediseña la arquitectura. No se limita a completar tu función actual, sino que entiende por qué existe la función, cómo se relaciona con el resto del código y en qué debería probablemente refactorizarse. El enfoque de “pensar antes de codificar” es real. Opus planea refactorizaciones de múltiples pasos, mantiene el contexto a través de bases de código extensas y produce código que parece revisado por un ingeniero sénior. Anthropic lo optimizó específicamente para flujos de trabajo “agénticos”: ese tipo de tareas en las que le dices “implementa esta función” y él planea, escribe, prueba e itera a través de múltiples archivos sin perder el hilo.

Puntos fuertes

  • Ventana de contexto de 1M de tokens (beta): Aproximadamente 750,000 palabras de código y documentación en una sola sesión. Puedes cargar un monorepositorio entero y hacer preguntas sobre él.
  • El rey del código autónomo: Obtiene las mejores puntuaciones en los benchmarks de codificación autónoma. Planea, ejecuta y se autocorrige en tareas largas sin perder coherencia.
  • Calidad del código: Produce consistentemente código bien estructurado e idiomático. Sigue los patrones que ya existen en tu base de código en lugar de imponer sus propias convenciones.
  • Razonamiento multi-archivo: Opus entiende cómo los cambios en un archivo afectan a todo un proyecto. Actualiza pruebas, tipos e interfaces cuando modifica implementaciones.
  • Pensamiento extendido: Para decisiones arquitectónicas difíciles, el modo de “pensamiento” le permite razonar sobre las ventajas y desventajas antes de comprometerse con un diseño.

Limitaciones honestas

  • Costo: El modelo más caro de su clase. Una sesión larga y autónoma revisando una base de código puede costar significativamente más que las equivalentes en Sonnet o GPT.
  • Velocidad: Más lento que los modelos más ligeros. Si necesitas algo rápido de una línea o la firma de una función, Opus es excesivo, casi como contratar a un cirujano para que te ponga una tirita.
  • Amplificación de costos autónomos: Las sesiones largas y sin supervisión pueden dispararse económicamente. Establece puntos de control y revisa los cambios periódicamente.

El Veredicto: El mejor socio de codificación basado en IA que el dinero puede comprar, y genuinamente cuesta dinero. Usa Opus 4.6 para refactorizaciones complejas, implementación de funciones a gran escala y decisiones arquitectónicas. Utiliza Sonnet para todo lo demás. La distinción es real, la diferencia de costos es significativa, y hacer coincidir el modelo con la tarea es la mitad del trabajo.