Qwen3.6 — 27B

Alibaba (Qwen Team) · Выпущено 22 апреля 2026 г.

8.3 /10 Общий рейтинг

Что это на самом деле

Команда Qwen только что выпустила модель, которую сообщество локального ИИ давно ждало. Qwen3.6-27B — это плотная модель с 27 миллиардами параметров, которая делает то, что кажется невозможным: она превосходит собственный флагман Alibaba на 397B (Qwen3.5-397B-A17B) во всех основных бенчмарках агентного программирования — SWE-bench Verified, SWE-bench Pro, Terminal-Bench 2.0, SkillsBench — при этом работая на одном GPU класса RTX 3090.

Это не инкрементальное обновление. Один только скачок в Terminal-Bench 2.0 (41.6 → 59.3) представляет собой 43% улучшение в практических терминальных рабочих процессах — тех самых реальных задачах кодирования, которые определяют, является ли локальная модель действительно полезной или только красивой в бенчмарках. Добавьте нативное понимание зрения и видео, новую функцию «Сохранение мышления» (Thinking Preservation), которая поддерживает согласованность рассуждений на протяжении многоходовых разговоров, и то же нативное контекстное окно 262K (расширяемое до 1M+), и вы получите модель, которая искренне переопределяет то, что возможно на потребительском оборудовании.

Настроение сообщества говорит само за себя: r/LocalLLaMA называет это «поворотным моментом для локального инференса» и «крупнейшим релизом года на данный момент». Независимые тестировщики сообщают, что она ощущается ощутимо более способной для реальных проектов кодирования — не только бенчмарков, но и реального опыта использования локального агента для фронтенд-процессов, рассуждений на уровне репозитория и итеративной разработки. Лицензирована под Apache 2.0, кванты GGUF уже доступны через Unsloth, те же требования к потребительскому GPU. Эпоха компромиссов в локальном ИИ только что закончилась — снова.

Ключевые преимущества

Превосходит 397B модель при размере 27B: SWE-bench Verified 77.2, SWE-bench Pro 53.5, Terminal-Bench 2.0 59.3, SkillsBench Avg5 48.2 — Qwen3.6-27B превосходит собственный флагман Alibaba Qwen3.5-397B-A17B (модель, в 15 раз превышающую её размер) во всех основных бенчмарках агентного программирования. Это не опечатка.
Огромный скачок в терминальных и агентных рабочих процессах: Terminal-Bench 2.0 прыгнул с 41.6 (у Qwen3.5-27B) до 59.3 — улучшение на 43%. SWE-bench Verified вырос с 75.0 до 77.2. Это не маргинальные приросты; они отражают фундаментально более способного агента-программиста.
Нативная мультимодальность с сохранением мышления: Изображения, видео, OCR и текст в одной модели, плюс новая функция, которая сохраняет контекст рассуждений на протяжении всей истории разговора — что делает её гораздо более последовательной в многоходовых агентных сессиях.
262K нативного контекста (расширяемо до 1M+): То же щедрое контекстное окно, что и у предшественника, с улучшенным поддержанием качества на длинных вводах. Скормите ей целую кодовую базу, 300-страничный PDF или недели разговоров.
Лицензия Apache 2.0 + поддержка GGUF в первый же день: Полностью открытая, коммерчески не ограниченная. Кванты Unsloth GGUF доступны через несколько часов после релиза. Комфортно работает на потребительских GPU.

Результаты тестов

Агентное программирование — SWE-bench Verified 77.2 Золотой стандарт для реальной разработки программного обеспечения. Qwen3.6-27B набирает больше баллов, чем собственный флагман Alibaba на 397B, и ставит его на расстояние удара от закрытых пограничных моделей — при доле от их размера.
Терминальные рабочие процессы — Terminal-Bench 2.0: 59.3 Скачок на 43% по сравнению с 41.6 у Qwen3.5-27B. Этот бенчмарк измеряет практические задачи разработки на основе терминала — именно ту работу, которую локальные ИИ-агенты выполняют каждый день.
Рассуждение — GPQA Diamond 87.8 Рассуждения на уровне выпускников ВУЗов, конкурирующие с моделями в 10 раз больше её размера. По сравнению с 85.5 у Qwen3.5-27B, что подтверждает, что прирост не ограничивается кодированием.

Честные ограничения

~17–20 ГБ VRAM в 4-бит: Тот же диапазон, что и у Qwen3.5-27B. Отлично на 24 ГБ картах (RTX 4090, 5090), но если вы находитесь на ультра-ограниченном оборудовании 16 ГБ без дискретного GPU, меньшие модели все равно будут казаться более отзывчивыми.
Очень свежий релиз — экосистема квантования все еще формируется: Хотя кванты Unsloth GGUF появились быстро, полная экосистема оптимизированных форматов (AWQ, GPTQ, ExLlamaV2) все еще развертывается. Дайте этому несколько дней.
Режим размышления может быть многословным: Следы рассуждений модели мощные, но иногда избыточные на простых задачах. Переключается — используйте режим без размышлений для быстрых запросов.
Немного не дотягивает до закрытых пограничных моделей на самых сложных задачах: На самых абсолютных сложных бенчмарках агентов с длинным горизонтом Claude Opus и GPT-5.2 все еще имеют небольшое преимущество. Для 95%+ реальной работы вы этого не заметите.

Вердикт: Корона локального ИИ переходит из рук в руки — в той же семье. Qwen3.6-27B берет все, что сделало Qwen3.5-27B лидером категории, и двигает каждую шкалу вперед: кардинально улучшенное агентное программирование (Terminal-Bench +43%), более сильное рассуждение (GPQA 87.8), усовершенствованная мультимодальность с сохранением мышления, и она по-прежнему работает на том же потребительском GPU. Консенсус сообщества мгновенен и ошеломляющ — это новый стандарт того, на что способен локальный ИИ. Если вы уже использовали Qwen3.5-27B, это обновление, о котором не нужно думать. Если нет, то это ваш знак начать.