Lokal / Maxfiy SI — Sizning miyangiz, Sizning qurilmangiz, Sizning qoidalaringiz

Mana radikal bir g'oya: agar siz o'z qurilmangizda haqiqatan ham aqlli SIni ishlata olsangiz va unga aytgan hech bir gapingiz qurilmangizdan tashqariga chiqmasa nima bo'ladi? Hech qanday bulutli serverlar yo'q. Ma'lumotlarni yig'ish yo'q. Obuna to'lovlari yo'q. Faqat siz, noutbukingiz va maxfiyligingizni boshidanoq hurmat qiladigan aql-idrok. Ochiq vaznli (open-weight) inqilobiga xush kelibsiz.

Filtr Barchasi Kundalik Ekosistema Rasm Yaratish Dasturlash Ilova Yaratuvchilar Tadqiqot Raqamli Arxitektorlar Akademik Ustozlar Video Musiqa va Ovoz Mahalliy / Shaxsiy AI Mahalliy Rasm Yaratish Mahalliy Video Yaratish AI Agentlar

GLM-5.2

Mahalliy / Shaxsiy AI Zhipu AI · Chiqarilgan 2026 yil 13 iyun
#1
9.0/10

Mahalliy AI uchun qoidalarni qayta yozadigan ochiq vaznli model. Design Arena #1, SWE-bench Pro 62.1%, Terminal-Bench 82.7, AkitaOnRails 87/100 — bularning barchasi shaxsiy uskunangizda yuklab olish, kvantlash va ishga tushirish uchun MIT litsenziyasi ostida mavjud. To'g'ri o'qitilgan 1M kontekst oynasi, ikki darajali fikrlash imkoniyati va uzoq ufqdagi muhandislik vazifalarida yopiq chegara yetakchilari bilan chinakamiga raqobatlashadigan birinchi ochiq model.

Kodlash va agentik ishlar uchun yaratilgan eng kuchli ochiq model — Design Arena #1 (Elo 1360), AkitaOnRails 87/100 Tier A (GLM-5.1 dan +41 ballga oshgan), SWE-bench Pro 62.1% (eng yaxshi ochiq vaznli ko'rsatkich), FrontierSWE 74.4% (Opus 4.8 dan 1% orqada). Cheklovlarsiz MIT litsenziyasi. 744B MoE (~40B faol) — DeepSeek V4 ning 1.6T-sidan ko'ra ixchamroq va bir vaqtning o'zida kuchli tasdiqlangan benchmarklarga ega. vLLM, SGLang, ktransformers da ishlaydi. Agressiv kvantlash orqali 256GB birlashtirilgan xotirali (unified memory) Mac'ga sig'adi (~241GB dinamik 2-bit).

744B MoE hali ham jiddiy apparatni talab qiladi — 256GB+ yagona xotira yoki ko'p GPU-li klasterlar. Noutbuk modeli emas. Mahalliy ko'rish qobiliyati yo'q. Qwen 3.6 27B yoki Gemma 4 kabi ixcham modellarga qaraganda har bir tokenga sekinroq. G'arb ekotizim asboblari (tooling) hali o'smoqda.


Open Weights MIT 1M Context MoE Coding Agentic Design Arena #1

Qwen3.6 — 27B

Mahalliy / Shaxsiy AI Alibaba (Qwen Team) · Chiqarilgan 2026-yil 22-aprel
#2
8.3/10

Alibaba'ning so'nggi 27B zich (dense) modeli nafaqat oldingi mahalliy AI qirolining o'rnini egalladi — u bitta iste'molchi GPU'sida ishlagan holda har bir yirik agentli kodlash benchmarklarida o'zlarining 397B flagmanidan o'zib ketadi. SWE-bench Verified 77.2, Terminal-Bench 2.0 59.3, tabiiy (native) ko'rish va video, Apache 2.0. Mahalliy ishlashning (local inference) burilish nuqtasi.

SWE-bench Verified (77.2), SWE-bench Pro (53.5), Terminal-Bench 2.0 (59.3) va SkillsBench Avg5 (48.2) da Qwen3.5-397B-A17B (397B MoE modeli) ni mag'lub etadi. GPQA Diamond 87.8. Fikrlashni saqlab qoladigan (thinking preservation) tabiiy multimodal. r/LocalLLaMA buni «yilning eng katta relizi» va «mahalliy ishlash (inference) uchun burilish nuqtasi» deb ataydi.

Oldingi versiya kabi VRAM profili (4-bitda ~17–20 GB); juda yangi bo'lgani uchun kvantlangan (quantized) versiyalari endi chiqmoqda; fikrlash (thinking) rejimi oddiyroq vazifalarda juda ko'p so'zli bo'lishi mumkin (o'chirish mumkin). Eng qiyin ufqni qamrab oluvchi (long-horizon) agent vazifalarida eng ilg'or (SOTA) yopiq modellarga ozgina yetmaydi.


Multimodal Open Weight Apache 2.0 Agentic Coding Vision + Video Free Offline

Gemma 4

Mahalliy / Shaxsiy AI Google DeepMind · Chiqarilgan 2026 yil 2 aprel (12B Unified: 2026 yil 3 iyun)
#3
8.1/10

Bitta model emas — beshta. Google DeepMind'ning Gemma 4 tarmog'i telefoningizda ishlaydigan 2 milliard parametrli qismdan tortib, serverlar uchun mo'ljallangan 31 milliard parametrli qudratli tizimgacha bo'lgan hamma narsani qamrab oladi. Har bir a'zoning o'ziga xos arxitekturasi, kuchli tomonlari va apparat talablari bor. E2B 1 GB operativ xotiraga sig'adi. 12B Unified noutbuk videokartasida to'liq multimodal AIni ishga tushiradi. 26B MoE har bir token uchun faqat 3.8B parametrni faollashtiradi. Barchasi Apache 2.0, barchasi ochiq vaznli. Ushbu qo'llanma apparatingiz va ishingizga qaysi Gemma mos kelishini aniq bilishingiz uchun har birini ko'rib chiqadi.

Telefondan noutbuk va servergacha bo'lgan beshta model. 12B Unified: enkoderlarsiz multimodallik, QAT bilan ~7 GB VRAM, oddiy GPU'larda 100+ token/s. E2B telefonlarda 1 GB xotirada ishlaydi. E4B smartfonda AIME 2026 da 42.5% ball to'playdi. 26B MoE ancha kam hisoblash bilan 31B sifatining ~97% ni beradi. 31B ochiq modellar orasida top-3 likka kiradi. Barchasi Apache 2.0. Barchasi 140+ tilni qo'llab-quvvatlaydi.

Beshta model besh xil murosani (trade-off) anglatadi. Edge (chekka) modellar fikrlash chuqurligidan voz kechadi. 12B ga yaxshi GPU kerak. 26B/31B ga esa jiddiy VRAM zarur. Bitta model hamma narsani qilmaydi — siz o'z apparatingizga mosini tanlaysiz. Eng silliq tajriba uchun Google asboblaridan foydalanish tavsiya etiladi.


Multimodal Open Weight Apache 2.0 On-Device QAT Free

Ko'p so'raladigan savollar

Lokal SI to’liq maxfiylikni ta’minlaydi (ma’lumotlar hech qachon qurilmangizdan tashqariga chiqmaydi), oflayn ishlaydi, doimiy obuna to’lovlariga ega emas va bulutli API cheklovlaridan xalos qiladi.

Sizga yetarli darajadagi VRAM xotirasiga ega yaxshi videokarta kerak bo’ladi (Llama 4 8B yoki Gemma 4 kabi kichik modellar uchun kamida 8-12 GB; Qwen 3.6 27B yoki Gemma 4 31B kabi kattaroq modellar uchun 16-24 GB+). Yoki birlashgan xotiraga (unified memory, 16-48 GB+) ega Apple Silicon Mac kompyuteri zarur. Faqat protsessorda (CPU) ishlash juda sekin bo’ladi.

Haqiqiy ochiq kodli modellar o’qitish ma’lumotlari to’plami va kodni o’z ichiga oladi. Ochiq vaznli modellar (DeepSeek, Llama, Gemma kabi) sizga lokal tarzda ishga tushirish uchun oldindan o’qitilgan vaznlarni beradi, ammo ularning aniq o’quv ma’lumotlari yopiq (maxfiy) bo’lib qoladi.

Eng oson usuli — Ollama, LM Studio yoki AnythingLLM kabi bepul foydalanuvchi ilovalaridan foydalanish. Ular orqa fondagi (backend) murakkab sozlamalarni o’z zimmasiga oladi va sizga toza interfeysda modellarni bir marta bosish orqali yuklab olish hamda ular bilan suhbatlashish imkonini beradi.