Claude Fable 5

Anthropic · Lanzado June 9, 2026

9.8 /10 Puntuación general

Lo que realmente es

Si Opus 4.8 era el ascenso, Fable 5 es la oficina de la esquina. El cambio de nombres de Anthropic — de niveles musicales (Haiku, Sonnet, Opus) a literarios (Fable, Mythos) — no es solo branding; señala una nueva clase de modelo. Fable 5 funciona con la misma arquitectura de clase Mythos que impulsa al restringido Mythos 5, pero con clasificadores de seguridad que lo hacen apto para uso general. Piénselo como un superdeportivo con el limitador de velocidad activado — sigue siendo lo más rápido en la carretera, solo que con barandillas en ciertas curvas.

Los números cuentan la historia. SWE-Bench Pro 80,3% no solo supera a GPT-5.5 (58,6%) — pone en vergüenza a todo el campo. FrontierCode Diamond al 29,3% significa que Fable 5 escribe código de calidad de producción cinco veces más eficientemente que GPT-5.5 (5,7%). En el Hebbia Finance Benchmark — razonamiento de documentos a nivel senior, lectura de gráficos, análisis de causa raíz — es #1. En CursorBench, abrió “una clase de problemas de largo horizonte que estaban fuera del alcance de modelos anteriores.”

Pero las demostraciones más reveladoras no son benchmarks. Stripe migró una base de código Ruby de 50 millones de líneas en un día — trabajo que le hubiera tomado a un equipo completo dos meses. El modelo completó Pokémon FireRed usando solo capturas de pantalla sin procesar — sin mapas, sin herramientas auxiliares, sin datos del estado del juego. Y cuando se le dio memoria persistente basada en archivos jugando Slay the Spire, su rendimiento mejoró 3× más que el de Opus 4.8.

La historia de seguridad vale la pena entenderla. Las consultas que tocan ciberseguridad, biología, química o destilación de modelos se redirigen automáticamente a Opus 4.8 — que sigue siendo un modelo de primer nivel, pero no la arquitectura Mythos completa. Esto ocurre en menos del 5% de las sesiones, y Anthropic reconoce algunos falsos positivos en consultas inofensivas. Es el precio de lanzar un modelo tan capaz de forma rápida y segura. El Mythos 5 sin restricciones está reservado para socios verificados a través de Project Glasswing — donde ya está ayudando a defender infraestructura de software crítica.

La verdadera pregunta es si el precio vale la pena. A $10/$50 por millón de tokens, Fable 5 cuesta aproximadamente 2× lo que Opus 4.8. Pero la eficiencia de tokens compensa parcialmente esto — lograr resultados líderes en FrontierCode con esfuerzo medio significa menos cómputo por tarea. Para profesionales cuyo tiempo vale más que su factura de API, las cuentas son simples. Para todos los demás, Opus 4.8 sigue siendo excelente. Pero si quiere el mejor modelo de IA de acceso general del planeta — aquel donde la ventaja crece a medida que la tarea se vuelve más difícil — este es.

Puntos fuertes

Capacidad de clase Mythos para todos: La misma arquitectura subyacente que el restringido Mythos 5, pero con clasificadores de seguridad que lo hacen ampliamente disponible. Fable 5 es estado del arte en casi todos los benchmarks evaluados — y la brecha sobre los competidores crece a medida que las tareas se vuelven más complejas. Esto no es incremental; es un salto generacional.
Agente autónomo que realmente cumple: Stripe comprimió meses de ingeniería en días — migrando una base de código Ruby de 50 millones de líneas en un día. El modelo planifica, delega a sub-agentes, se auto-verifica con sus propias pruebas y sigue hasta que el trabajo está hecho. Las sesiones autónomas de varios días son la nueva normalidad.
Avance en visión: Estado del arte en tareas de visión. Puede extraer números precisos de figuras científicas, reconstruir aplicaciones web a partir de capturas de pantalla y completar Pokémon FireRed solo con visión — sin herramientas auxiliares, sin datos del estado del juego. Los modelos anteriores necesitaban andamiajes complejos; Fable 5 solo necesita ojos.
Memoria a lo largo de millones de tokens: La memoria persistente basada en archivos mejoró su rendimiento en Slay the Spire 3× más que Opus 4.8. El modelo mantiene el enfoque en sesiones de un millón de tokens y realmente mejora sus resultados usando sus propias notas. El contexto largo no es solo una especificación — es una función que realmente funciona.
La eficiencia de tokens gana en las cuentas: A pesar de un precio por token 2× mayor que Opus 4.8, Fable 5 obtiene la puntuación más alta en FrontierCode incluso con esfuerzo medio. Más trabajo hecho por token significa que el costo real por tarea es frecuentemente competitivo. El modelo caro que ahorra dinero en problemas difíciles.

Resumen de Benchmarks

SWE-Bench Pro — 80,3% (SOTA) Ingeniería de software del mundo real. Aplasta a GPT-5.5 (58,6%) por 21,7 puntos y a su predecesor Opus 4.8 (69,2%) por 11,1 puntos. La mayor ventaja que cualquier modelo haya tenido jamás.
FrontierCode Diamond — 29,3% (SOTA) Código de producción de alta calidad con eficiencia de tokens. Marca 29,3% vs 13,4% de Opus 4.8 y 5,7% de GPT-5.5. Logra el mejor rendimiento incluso con esfuerzo de razonamiento medio.
Hebbia Finance Benchmark — #1 Razonamiento de documentos a nivel senior, interpretación de gráficos y análisis de causa raíz. La puntuación más alta de cualquier modelo evaluado. IMC confirmó que superó las evaluaciones de análisis de trading casi en todos los rubros.
CursorBench — SOTA Estado del arte en el benchmark de Cursor. 'Abrió una clase de problemas de largo horizonte que estaban fuera del alcance de modelos anteriores.' — Michael Truell, CEO de Cursor.

Limitaciones honestas

⚠️ Acceso suspendido para no ciudadanos de EE.UU.: El 12 de junio de 2026, el gobierno de EE.UU. emitió una directiva de control de exportaciones que suspende todo acceso a Fable 5 y Mythos 5 para cualquier ciudadano extranjero — ya sea dentro o fuera de Estados Unidos. Anthropic ha tenido que desactivar el modelo para todos los clientes para cumplir con la orden. Todos los demás modelos de Anthropic siguen disponibles. Anthropic no está de acuerdo con la directiva y trabaja para restablecer el acceso. Consulte su anuncio para conocer el estado más reciente.
El precio premium es real: $10 por millón de tokens de entrada, $50 por millón de tokens de salida — aproximadamente 2× las tarifas de Opus 4.8. Los suscriptores Pro obtienen acceso incluido hasta el 22 de junio, luego entran los créditos de uso. Los usuarios intensivos sentirán la factura.
Enrutamiento de seguridad conservador: Las salvaguardas se activan en <5% de las sesiones, redirigiendo consultas marcadas a Opus 4.8. Algunos falsos positivos en trabajo profesional legítimo (investigación en ciberseguridad, química, biología). Las barandillas reflejan el poder de doble uso del modelo subyacente.
No es el Mythos 5 completo: La versión sin restricciones está bloqueada detrás de Project Glasswing para ciberdefensores e investigadores verificados. Lo que usted obtiene es explícitamente una versión vigilada — extremadamente capaz, pero con ruedas de entrenamiento en ciertos temas.
Benchmarks independientes pendientes: Las afirmaciones del día de lanzamiento son detalladas y ricas en ejemplos, pero los resultados completos de terceros en LMSYS Arena, Artificial Analysis y SWE-Bench actualizados aún están emergiendo. Verifique antes de coronar.

El Veredicto: La frontera se acaba de mover. Claude Fable 5 no es una iteración sobre Opus 4.8 — es un salto generacional envuelto en barandillas de seguridad. La ventaja en SWE-Bench Pro (80,3% vs 58,6% de GPT-5.5) no es un error de redondeo — es un abismo. La brecha en FrontierCode es aún mayor. Y a diferencia de modelos que ganan benchmarks pero tropiezan en la práctica, Fable 5 tiene los recibos: Stripe migrando 50 millones de líneas de código en un día, completación de juegos solo con visión y memoria persistente que realmente funciona en sesiones largas. La trampa es el precio — $10/$50 por millón de tokens no es dinero casual — y el enrutamiento de seguridad conservador ocasionalmente lo enviará a Opus 4.8 en consultas legítimas. Pero para profesionales que necesitan el cerebro de IA más potente disponible al público, y cuyo trabajo involucra ingeniería compleja, investigación profunda o tareas agénticas de largo horizonte — este es. El mejor modelo de IA que realmente puede usar.