GPT‑5.5

OpenAI · Выпущено 23 апреля 2026 г.

9.9 /10 Общий рейтинг

Что это на самом деле

Если бы история ИИ была рок-группой, ChatGPT был бы The Beatles — не обязательно самыми технически изощренными в каждый момент, но теми, кто изменил то, как, по всеобщему ожиданию, должна звучать музыка. GPT-5.5 — это альбом, где группа перестает играть каверы и начинает писать симфонии. Он не просто отвечает на вопросы — он планирует, выполняет, использует инструменты, проверяет собственную работу и продолжает, пока дело не будет сделано на самом деле.

Думайте об этом как о переходе от очень умного помощника к очень умному коллеге, который никогда не забывает инструктаж. GPT-5.5 планирует многоэтапные проблемы, автономно использует инструменты, управляет вашим компьютером при необходимости и выполняет рабочие процессы, которые раньше требовали нескольких моделей и ручной оркестровки. Он читает, пишет, генерирует изображения, просматривает веб, запускает код и делает все это на 40% меньшим количеством токенов — это означает, что ваши сложные задачи выполняются быстрее и дешевле, даже при более высокой цене за токен. Сдвиг в сторону агентов реален: ранние опытные пользователи сообщают о завершении сложных рабочих процессов с меньшим количеством подсказок и меньшим количеством раундов исправлений. Как выразился Итан Моллик: «Он строит именно то, что я прошу».

Ключевые преимущества

Доминирование в GDPval (84,9%): Протестирован на 44 реальных профессиях — юридический анализ, финансовое моделирование, поддержка клиентов, наука о данных — GPT-5.5 обходит 83,0% у GPT-5.4 и 80,3% у Opus 4.7. Это измеряет, действительно ли модель помогает профессионалам выполнять их работу, а не игрушечные бенчмарки.
Агентное выполнение, которое действительно работает: Планирует многоэтапные задачи, самостоятельно использует инструменты, проверяет свой собственный вывод и продолжает, пока работа не будет сделана. OSWorld-Verified 78,7% (рост с 75,0%) означает, что он ориентируется на вашем рабочем столе лучше, чем большинство стажеров.
На 40% меньше выходных токенов: Та же задержка на токен, что и у GPT-5.4, но он выражает свои мысли меньшим количеством слов. Реальная стоимость задачи падает, несмотря на удвоенную цену за токен — математика работает в пользу активных пользователей.
Tau2-Bench Telecom 98,0%: Сложные рабочие процессы агента по обслуживанию клиентов выполняются почти идеально. Это бенчмарк, доказывающий, что ярлык «агент» — не просто маркетинг.
Широта экосистемы: Доступен в вебе, iOS, Android, десктопных приложениях и через API. Пользовательские GPT, интеграция с Codex, постоянная память, Canvas, генерация изображений — все, что вы уже используете, теперь управляется мозгом, который действительно доводит дело до конца.

Результаты тестов

GDPval — 84,9% Выполнение реальных профессиональных задач в 44 профессиях. Решительно обходит GPT-5.4 (83,0%), Opus 4.7 (80,3%) и Gemini 3.1 Pro (67,3%).
Artificial Analysis — #1 Оценка Intelligence Index равна 60 — на 3 пункта выше предыдущей тройной ничьей. Самый широкий независимый составной бенчмарк.
OSWorld-Verified — 78,7% Бенчмарк использования компьютера, в котором модель автономно управляет десктопными приложениями. Рост с 75,0% у GPT-5.4.
Tau2-Bench — 98,0% Сложные рабочие процессы агента обслуживания клиентов выполнены почти безупречно. Доказывает агентные возможности в структурированных бизнес-задачах.

Честные ограничения

Скачок цен: Затраты на API удваиваются до $5/М на входе и $30/М на выходе. Уровень Pro еще круче. Эффективность токенов на 40% компенсирует это для активных пользователей, но легкие пользователи почувствуют счет.
Оговорка о галлюцинациях: В одном раннем независимом отчете отмечен более высокий уровень галлюцинаций в определенных оценках всеведения. OpenAI заявляет о лучшем суждении через рассуждения, но относитесь к критически важной для истины работе (юридическая, медицинская, финансовая) со слоями проверки. Это требует больше независимого тестирования.
API еще не запущен: На старте GPT-5.5 доступен в ChatGPT и Codex, но API появится «очень скоро». Если вы строите на базе API, вам придется подождать.
Ограждения безопасности усилены: Самая сильная система безопасности, которую выпускала OpenAI. Большинство пользователей этого не заметят, но опытные пользователи, тестирующие пограничные случаи — исследования безопасности, творческая фантастика, состязательное тестирование — иногда будут сталкиваться с отказами.

Вердикт: Эра агентов получает своего самого явного чемпиона. GPT-5.5 не просто итерирует GPT-5.4 — он переопределяет то, что значит «достаточно хорошо для сдачи работы». Лидерство в GDPval, #1 в Artificial Analysis и почти совершенство в Tau2-Bench делают его повседневным ИИ, который наконец-то заслуживает слова «коллега». Он стоит дороже за токен — но выполняет больше работы за доллар. Если вы подписываетесь на один ИИ в 2026 году, то это тот самый, который доводит сложную, неоднозначную работу с множеством инструментов до финиша с минимальным присмотром.