Claude — Opus 4.8
Anthropic · Выпущено 28 мая 2026 г.
Что это на самом деле
Если ChatGPT — экстраверт на вечеринке, а Gemini читает в углу, то Claude Opus 4.8 — это спокойный, ясно мыслящий человек, который действительно слушает то, что вы говорите, — а теперь еще и честно говорит вам, когда не уверен в чем-то. Эта вторая часть является новой, и она важнее любых цифр в бенчмарках.
Последний флагман Anthropic не просто обрабатывает информацию — он обрабатывает ее добросовестно. Opus 4.8 в 4 раза реже выдумывает уверенное “Я закончил”, когда на самом деле это не так. Он проактивно сигнализирует о неуверенности. Он отвергает плохие предположения вместо того, чтобы радостно их выполнять. В мире, где каждая модель ИИ претендует на звание лучшей, эта отличается редкой готовностью признать, когда она не уверена.
Технические улучшения тоже реальны. Dynamic Workflows (Динамические рабочие процессы) позволяют ведущему агенту Opus порождать сотни параллельных субагентов — один анализирует финансы, другой просматривает юридические оговорки, третий составляет резюме, и все это с сохранением контрольных точек, чтобы ничего не потерялось. Контроль усилий означает, что вы, наконец, можете выбирать глубину: быстрый ответ, тщательный анализ или глубокое исследование. А контекстное окно на 1 миллион токенов не просто хранит ваши документы — оно рассуждает над ними без проблем “забывания в середине”, которые закрадывались в версию 4.7.
Загвоздка? По-прежнему та же. Вы платите за это качество. В то время как бесплатный уровень ChatGPT щедр, а Gemini поставляется в комплекте с вашей подпиской Google, бесплатный уровень Claude ограничен. Настоящий опыт Opus начинается с 20 долларов в месяц и может достигать 200 долларов в месяц. Но для профессионалов, которые выставляют счета по часам и нуждаются в ответах, которым они могут реально доверять — математика не изменилась. Она по-прежнему проста.
Ключевые преимущества
- Честность, которую действительно можно измерить: В 4 раза ниже вероятность того, что Opus 4.8 будет фабриковать утверждения о выполнении работы. Он проактивно отмечает неуверенность, сопротивляется плохим предположениям и говорит «Я не знаю», когда это честный ответ. Это не маркетинговое заявление — это самый большой качественный скачок по сравнению с версиями 4.6 и 4.7.
- Окно контекста в 1 миллион токенов: 750,000 слов — десять романов, полная кодовая база или конспекты лекций за весь семестр — в одном разговоре. И в отличие от 4.7, качество контекста не ухудшается заметно в средних диапазонах.
- Динамические рабочие процессы (Dynamic Workflows): Ведущий агент Opus порождает сотни параллельных субагентов и управляет ими для решения масштабных задач — поиска исследований, анализа документов, проверок кода. Это управление проектами с использованием ИИ с контрольными точками для длительных рабочих процессов.
- Контроль усилий: Выбирайте Default (быстрые ответы), Extra (тщательный анализ) или Max (глубокое исследование). Больше нет универсального мышления для всего. Быстрый режим (Fast mode) обеспечивает скорость в 2.5 раза выше и стоимость в 3 раза ниже для более легких задач.
- Лучшая в своем классе надежность агентов: 100% выполнение в бенчмарке Super-Agent. 83.4% в Online-Mind2Web (браузерный агент). Первая модель, превзошедшая планку 10% успешности в Legal Agent Benchmark. Когда вы поручаете ей сложную задачу и уходите, она действительно ее завершает.
-
Knowledge Work (Интеллектуальная работа) — 1,890 (рост с 1,753) Внутренний бенчмарк, измеряющий качество профессионального анализа, синтеза и написания. Улучшение на 7.8% по сравнению с Opus 4.7 — это тот прирост, который проявляется в реальной повседневной работе.
-
Online-Mind2Web — 83.4% (#1 браузерный агент) Задачи браузерного агента. Opus 4.8 превосходит и Opus 4.7 (82.8%), и GPT-5.5. Самая сильная из протестированных моделей для управления компьютером и браузером.
-
Legal Agent Benchmark — первая, преодолевшая барьер 10% Существенная юридическая работа по стандарту all-pass. Повышение точности напрямую влияет на то, сколько реальной работы юристы-клиенты могут делегировать с уверенностью.
Честные ограничения
- Премиальная цена: Pro за $20/мес, Max за $100–$200/мес. Затраты на API составляют $5 за входные / $25 за выходные токены за миллион. Кэширование промптов помогает (экономия до 90%), но при интенсивном использовании расходы быстро растут.
- Нет встроенной генерации изображений: В отличие от ChatGPT и Gemini, Claude не может создавать изображения. Он блестяще их анализирует, но если вам нужна картинка, потребуется другой инструмент.
- Меньшая экосистема: Меньше интеграций, нет магазина плагинов и более ограниченный бесплатный уровень по сравнению с ChatGPT. Claude в Microsoft 365 расширяется, но пока не повсеместно.
- Расход токенов на глубоких задачах: Более глубокое обдумывание, которое делает Opus 4.8 более надежным, также означает, что он использует больше токенов за диалог при сложной работе. Быстрый режим смягчает это для простых задач, но ожидайте более высоких затрат на исследовательских сессиях.
Вердикт: Если Opus 4.6 был тихим профессионалом, на котором вы останавливаете свой выбор, то Opus 4.8 — это тот же профессионал после повышения. Все, что сделало Claude выбором экспертов, осталось — понимание прочитанного, качество письма, контекст в миллион токенов. Но теперь он также честен в том, чего не знает, острее в своих суждениях и способен выполнять длительные автономные рабочие процессы без постоянных проверок. Подвох остался прежним: вы платите премию за премиальное качество. Но для всех, чья работа связана с длинными документами, тщательным анализом или решениями, которые действительно важны — это модель, которая работает лучше всего, когда работа имеет наибольшее значение.