"Nima uchun SI modellarini bulutda emas, lokal tarzda ishga tushirish kerak?"

"Lokal SI to\u0026rsquo;liq maxfiylikni ta\u0026rsquo;minlaydi (ma\u0026rsquo;lumotlar hech qachon qurilmangizdan tashqariga chiqmaydi), oflayn ishlaydi, doimiy obuna to\u0026rsquo;lovlariga ega emas va bulutli API cheklovlaridan xalos qiladi."

"Lokal SI modellarini ishga tushirish uchun qanday qurilma talab qilinadi?"

"Sizga yetarli darajadagi VRAM xotirasiga ega yaxshi videokarta kerak bo\u0026rsquo;ladi (Llama 4 8B yoki Gemma 4 kabi kichik modellar uchun kamida 8-12 GB; Qwen 3.6 27B yoki Gemma 4 31B kabi kattaroq modellar uchun 16-24 GB+). Yoki birlashgan xotiraga (unified memory, 16-48 GB+) ega Apple Silicon Mac kompyuteri zarur. Faqat protsessorda (CPU) ishlash juda sekin bo\u0026rsquo;ladi."

"Ochiq kodli (open-source) va ochiq vaznli (open-weight) modellar o'rtasidagi farq nima?"

"Haqiqiy ochiq kodli modellar o\u0026rsquo;qitish ma\u0026rsquo;lumotlari to\u0026rsquo;plami va kodni o\u0026rsquo;z ichiga oladi. Ochiq vaznli modellar (DeepSeek, Llama, Gemma kabi) sizga lokal tarzda ishga tushirish uchun oldindan o\u0026rsquo;qitilgan vaznlarni beradi, ammo ularning aniq o\u0026rsquo;quv ma\u0026rsquo;lumotlari yopiq (maxfiy) bo\u0026rsquo;lib qoladi."

"Qanday qilib lokal SI modelini ishlatishni boshlashim mumkin?"

"Eng oson usuli — Ollama, LM Studio yoki AnythingLLM kabi bepul foydalanuvchi ilovalaridan foydalanish. Ular orqa fondagi (backend) murakkab sozlamalarni o\u0026rsquo;z zimmasiga oladi va sizga toza interfeysda modellarni bir marta bosish orqali yuklab olish hamda ular bilan suhbatlashish imkonini beradi."

Eng yaxshi lokal SI modellari (2026) — DeepSeek V4, Qwen3.6-27B, Gemma 4

GLM-5.2

Mahalliy / Shaxsiy AI Zhipu AI · Chiqarilgan 2026 yil 13 iyun

9.0/10

Asosiy g'oya

Mahalliy AI uchun qoidalarni qayta yozadigan ochiq vaznli model. Design Arena #1, SWE-bench Pro 62.1%, Terminal-Bench 82.7, AkitaOnRails 87/100 — bularning barchasi shaxsiy uskunangizda yuklab olish, kvantlash va ishga tushirish uchun MIT litsenziyasi ostida mavjud. To'g'ri o'qitilgan 1M kontekst oynasi, ikki darajali fikrlash imkoniyati va uzoq ufqdagi muhandislik vazifalarida yopiq chegara yetakchilari bilan chinakamiga raqobatlashadigan birinchi ochiq model.

Nima uchun bu eng yaxshisi

Kodlash va agentik ishlar uchun yaratilgan eng kuchli ochiq model — Design Arena #1 (Elo 1360), AkitaOnRails 87/100 Tier A (GLM-5.1 dan +41 ballga oshgan), SWE-bench Pro 62.1% (eng yaxshi ochiq vaznli ko'rsatkich), FrontierSWE 74.4% (Opus 4.8 dan 1% orqada). Cheklovlarsiz MIT litsenziyasi. 744B MoE (~40B faol) — DeepSeek V4 ning 1.6T-sidan ko'ra ixchamroq va bir vaqtning o'zida kuchli tasdiqlangan benchmarklarga ega. vLLM, SGLang, ktransformers da ishlaydi. Agressiv kvantlash orqali 256GB birlashtirilgan xotirali (unified memory) Mac'ga sig'adi (~241GB dinamik 2-bit).

Kamchiliklari

744B MoE hali ham jiddiy apparatni talab qiladi — 256GB+ yagona xotira yoki ko'p GPU-li klasterlar. Noutbuk modeli emas. Mahalliy ko'rish qobiliyati yo'q. Qwen 3.6 27B yoki Gemma 4 kabi ixcham modellarga qaraganda har bir tokenga sekinroq. G'arb ekotizim asboblari (tooling) hali o'smoqda.

Open Weights MIT 1M Context MoE Coding Agentic Design Arena #1

Batafsil o'qish Rasmiy veb-sayt

Qwen3.6 — 27B

Mahalliy / Shaxsiy AI Alibaba (Qwen Team) · Chiqarilgan 2026-yil 22-aprel

8.3/10

Asosiy g'oya

Alibaba'ning so'nggi 27B zich (dense) modeli nafaqat oldingi mahalliy AI qirolining o'rnini egalladi — u bitta iste'molchi GPU'sida ishlagan holda har bir yirik agentli kodlash benchmarklarida o'zlarining 397B flagmanidan o'zib ketadi. SWE-bench Verified 77.2, Terminal-Bench 2.0 59.3, tabiiy (native) ko'rish va video, Apache 2.0. Mahalliy ishlashning (local inference) burilish nuqtasi.

Nima uchun bu eng yaxshisi

SWE-bench Verified (77.2), SWE-bench Pro (53.5), Terminal-Bench 2.0 (59.3) va SkillsBench Avg5 (48.2) da Qwen3.5-397B-A17B (397B MoE modeli) ni mag'lub etadi. GPQA Diamond 87.8. Fikrlashni saqlab qoladigan (thinking preservation) tabiiy multimodal. r/LocalLLaMA buni «yilning eng katta relizi» va «mahalliy ishlash (inference) uchun burilish nuqtasi» deb ataydi.

Kamchiliklari

Oldingi versiya kabi VRAM profili (4-bitda ~17–20 GB); juda yangi bo'lgani uchun kvantlangan (quantized) versiyalari endi chiqmoqda; fikrlash (thinking) rejimi oddiyroq vazifalarda juda ko'p so'zli bo'lishi mumkin (o'chirish mumkin). Eng qiyin ufqni qamrab oluvchi (long-horizon) agent vazifalarida eng ilg'or (SOTA) yopiq modellarga ozgina yetmaydi.

Multimodal Open Weight Apache 2.0 Agentic Coding Vision + Video Free Offline

Batafsil o'qish Rasmiy veb-sayt

Gemma 4

Mahalliy / Shaxsiy AI Google DeepMind · Chiqarilgan 2026 yil 2 aprel (12B Unified: 2026 yil 3 iyun)

8.1/10

Asosiy g'oya

Bitta model emas — beshta. Google DeepMind'ning Gemma 4 tarmog'i telefoningizda ishlaydigan 2 milliard parametrli qismdan tortib, serverlar uchun mo'ljallangan 31 milliard parametrli qudratli tizimgacha bo'lgan hamma narsani qamrab oladi. Har bir a'zoning o'ziga xos arxitekturasi, kuchli tomonlari va apparat talablari bor. E2B 1 GB operativ xotiraga sig'adi. 12B Unified noutbuk videokartasida to'liq multimodal AIni ishga tushiradi. 26B MoE har bir token uchun faqat 3.8B parametrni faollashtiradi. Barchasi Apache 2.0, barchasi ochiq vaznli. Ushbu qo'llanma apparatingiz va ishingizga qaysi Gemma mos kelishini aniq bilishingiz uchun har birini ko'rib chiqadi.

Nima uchun bu eng yaxshisi

Telefondan noutbuk va servergacha bo'lgan beshta model. 12B Unified: enkoderlarsiz multimodallik, QAT bilan ~7 GB VRAM, oddiy GPU'larda 100+ token/s. E2B telefonlarda 1 GB xotirada ishlaydi. E4B smartfonda AIME 2026 da 42.5% ball to'playdi. 26B MoE ancha kam hisoblash bilan 31B sifatining ~97% ni beradi. 31B ochiq modellar orasida top-3 likka kiradi. Barchasi Apache 2.0. Barchasi 140+ tilni qo'llab-quvvatlaydi.

Kamchiliklari

Beshta model besh xil murosani (trade-off) anglatadi. Edge (chekka) modellar fikrlash chuqurligidan voz kechadi. 12B ga yaxshi GPU kerak. 26B/31B ga esa jiddiy VRAM zarur. Bitta model hamma narsani qilmaydi — siz o'z apparatingizga mosini tanlaysiz. Eng silliq tajriba uchun Google asboblaridan foydalanish tavsiya etiladi.

Multimodal Open Weight Apache 2.0 On-Device QAT Free

Batafsil o'qish Rasmiy veb-sayt

Lokal / Maxfiy SI — Sizning miyangiz, Sizning qurilmangiz, Sizning qoidalaringiz

Qidiruv natijalari

GLM-5.2

Qwen3.6 — 27B

Gemma 4

Ko'p so'raladigan savollar