Qwen3.6 — 27B

Alibaba (Qwen Team) · Chiqarilgan 2026-yil 22-aprel

8.3 /10 Umumiy baho

Aslida bu nima

Qwen jamoasi mahalliy AI hamjamiyati kutgan modelni endigina taqdim etdi. Qwen3.6-27B bu imkonsiz bo’lib tuyulgan narsani taqdim etuvchi zich (dense) 27 milliard parametrli modeldir: u bitta RTX 3090 toifali GPU da ishlagan holda barcha yirik agentli kodlash benchmarklarida — SWE-bench Verified, SWE-bench Pro, Terminal-Bench 2.0, SkillsBench — Alibaba’ning o’zining 397B flagmanidan (Qwen3.5-397B-A17B) ustun keladi.

Bu bosqichma-bosqich (incremental) yangilanish emas. Yolg’iz Terminal-Bench 2.0 sakrashi (41.6 → 59.3) terminaldagi amaliy ish jarayonlarining 43% yaxshilanganini anglatadi — mahalliy model haqiqatdan ham foydalimi yoki shunchaki benchmarklarda chiroyli ko’rinadimi, shuni belgilab beradigan haqiqiy hayotdagi kodlash vazifalari. Bunga tabiiy (native) ko’rish va videoni tushunish, ko’p bosqichli suhbatlarda fikrlash muvofiqligini saqlaydigan yangi “Fikrlashni saqlash” xususiyatini va o’sha 262K tabiiy kontekst oynasini (1M+ gacha kengaytiriladigan) qo’shing, shunda iste’molchi uskunalarida nima qilish mumkinligini haqiqatdan ham qayta aniqlaydigan modelga ega bo’lasiz.

Hamjamiyatning munosabati hamma narsani aytib turibdi: r/LocalLLaMA buni “mahalliy ishlash (inference) uchun burilish nuqtasi” va “shu paytgacha yilning eng katta relizi” deb ataydi. Mustaqil testerlarning xabar berishicha, u haqiqiy kodlash loyihalari uchun sezilarli darajada qobiliyatliroq — nafaqat benchmarklar, balki frontend ish oqimlari, repozitoriy darajasidagi mantiqiy xulosalar va iterativ rivojlanish uchun mahalliy agentdan foydalanishning haqiqiy tajribasi. Apache 2.0 litsenziyasiga ega, GGUF kvantlari Unsloth orqali allaqachon mavjud bo’lib, xuddi o’sha iste’molchi-GPU xotira hajmini talab qiladi. Mahalliy AI da murosaga kelish davri hozirgina tugadi — yana.

Asosiy afzalliklari

27B hajmda 397B modelni mag’lub etadi: SWE-bench Verified 77.2, SWE-bench Pro 53.5, Terminal-Bench 2.0 59.3, SkillsBench Avg5 48.2 — Qwen3.6-27B har bir yirik agentli kodlash benchmarklarida Alibaba’ning o’zining Qwen3.5-397B-A17B (undan 15 marta katta model) flagmanidan ustun keladi. Bu xato yozilgan emas.
Terminal va agent ish oqimlarida katta sakrash: Terminal-Bench 2.0 41.6 dan (Qwen3.5-27B da) 59.3 gacha ko’tarildi — 43% yaxshilanish. SWE-bench Verified 75.0 dan 77.2 ga oshdi. Bular shunchaki arzimas yutuqlar emas; ular tubdan qobiliyatliroq kodlovchi agentni aks ettiradi.
Fikrlashni saqlaydigan (Thinking Preservation) tabiiy multimodal: Tasvirlar, video, OCR va matn bitta modelda, shuningdek, suhbat tarixi davomida mantiqiy xulosalash (reasoning) kontekstini saqlaydigan yangi xususiyat — uni ko’p bosqichli (multi-turn) agent seanslarida ancha izchil qiladi.
262K tabiiy kontekst (1M+ gacha kengaytiriladigan): Uzun ma’lumotlarda sifatni yaxshiroq saqlash bilan birga o’zidan oldingi versiya bilan bir xil saxiy kontekst oynasi. Unga to’liq kod bazasini, 300 betlik PDF-ni yoki haftalik suhbatlarni bering.
Apache 2.0 Litsenziyasi + Birinchi kundan GGUF yordami: To’liq ochiq, tijorat cheklovlarisiz. Unsloth GGUF kvantlari (quants) chiqarilganidan keyin bir necha soat ichida mavjud bo’ldi. Iste’molchi GPU’larida bemalol ishlaydi.

Benchmark natijalari

Agentli kodlash (Agentic Coding) — SWE-bench Verified 77.2 Haqiqiy dasturiy ta'minot muhandisligi uchun oltin standart benchmarki. Qwen3.6-27B Alibaba'ning 397B flagmanidan yuqoriroq ball oladi va uni yetakchi yopiq modellar bilan bir darajaga qo'yadi — ularning hajmidan ancha kichik bo'lsa-da.
Terminal ish oqimlari — Terminal-Bench 2.0: 59.3 Qwen3.5-27B dagi 41.6 dan 43% lik sakrash. Bu benchmark terminalga asoslangan amaliy rivojlanish vazifalarini o'lchaydi — mahalliy AI agentlari har kuni bajaradigan ishning ayni o'zi.
Mantiqiy xulosalash (Reasoning) — GPQA Diamond 87.8 O'zidan 10 marta katta modellar bilan raqobatlasha oladigan magistratura darajasidagi mantiqiy xulosa. Qwen3.5-27B dagi 85.5 dan ko'tarildi, bu yutuqlar faqat kodlash bilan cheklanmasligini tasdiqlaydi.

Haqiqiy cheklovlar

4-bitda ~17–20 GB VRAM: Qwen3.5-27B bilan bir xil darajada. 24 GB kartalarda (RTX 4090, 5090) a’lo, ammo agar siz diskret GPU bo’lmagan, o’ta cheklangan 16 GB uskunada bo’lsangiz, kichikroq modellar baribir chaqqonroq tuyuladi.
Juda yangi reliz — kvantlash ekotizimi endi shakllanmoqda: Unsloth GGUF kvantlari tez paydo bo’lgan bo’lsa-da, optimallashtirilgan formatlarning (AWQ, GPTQ, ExLlamaV2) to’liq ekotizimi endi tarqalmoqda. Unga bir necha kun bering.
Fikrlash rejimi ko’p so’zli bo’lishi mumkin: Modelning fikrlash izlari kuchli, lekin ba’zida oddiy vazifalarda ortiqcha bo’lishi mumkin. Sozlash mumkin — tezkor so’rovlar uchun fikrlashsiz (non-thinking) rejimdan foydalaning.
Eng qiyin vazifalarda yetakchi yopiq modellar darajasida emas: Mutlaqo eng murakkab uzoq ufqli agent benchmarklarida, Claude Opus va GPT-5.2 hali ham biroz ustunlikka ega. Haqiqiy ishning 95%+ qismida buni sezmaysiz.

Xulosa: Mahalliy AI toji qo’ldan-qo’lga o’tadi — aynan o’sha oilaning ichida. Qwen3.6-27B Qwen3.5-27B ni toifa yetakchisiga aylantirgan hamma narsani oladi va har bir ko’rsatkichni oldinga suradi: agentli kodlash sezilarli darajada yaxshilangan (Terminal-Bench +43%), kuchliroq mantiqiy xulosa (GPQA 87.8), fikrlashni saqlaydigan takomillashtirilgan multimodal va u hali ham o’sha iste’molchi GPU’sida ishlaydi. Hamjamiyat kelishuvi darhol va mutlaqdir — bu mahalliy AI nima qila olishi uchun yangi standartdir. Agar siz allaqachon Qwen3.5-27B ni ishlatayotgan bo’lsangiz, bu o’ylab o’tirmasdan yangilanadigan (upgrade) narsadir. Agar yo’q bo’lsa, bu boshlash uchun sizga ishoradir.