ذكاء اصطناعي محلي / خاص — عقلك، جهازك، قواعدك

إليك فكرة جذرية: ماذا لو استطعت تشغيل ذكاء اصطناعي ذكي فعلاً على جهازك الخاص، دون أن تغادر أي معلومة تخبره بها حدود حاسوبك؟ لا خوادم سحابية. لا جمع بيانات. لا اشتراكات شهرية. فقط أنت، وحاسوبك المحمول، وذكاء يحترم خصوصيتك بالتصميم. مرحباً بك في ثورة النماذج مفتوحة الأوزان.

تصفية الكل النظام البيئي اليومي توليد الصور البرمجة منشئو التطبيقات البحث المهندسون الرقميون الموجهون الأكاديميون فيديو موسيقى وصوت ذكاء اصطناعي محلي / خاص وكلاء ذكاء اصطناعي

DeepSeek V4

ذكاء اصطناعي محلي / خاص DeepSeek · تم الإصدار April 24, 2026
#1
8.3/10

عملاق MoE مفتوح الأوزان الذي يجعل 'تشغيل ذكاء اصطناعي على مستوى الحدود على أجهزتك الخاصة' واقعياً لأول مرة. 1.6 تريليون معامل (49 مليار نشط)، مليون رمز سياق وكفاءة استدلال تخفض الحوسبة بنسبة ~73% — كل ذلك تحت رخصة MIT.

1.6T Pro (49B نشط) و284B Flash (13B نشط) — كلاهما أوزان مفتوحة MIT بسياق مليون رمز. ~73% تخفيض FLOPs و~90% تخفيض KV cache مقابل V3.2. أسعار API أرخص 3-7× من معادلات Claude Opus. منافس لـ GPT-5.4 وGemini 3.1 Pro في الاستدلال.

إصدار Preview — معايير مستقلة كاملة (SWE-Bench Pro, Terminal-Bench) لم تُنشر بعد من أطراف ثالثة. V4-Pro يحتاج عتاداً جاداً (مجموعات GPU متعددة). أرقام ذاتية التقرير — عاملها بشك صحي. لا مخرجات متعددة الوسائط أصلية.


Open Weight MIT MoE 1M Context Agentic Free / Cheap API

Qwen3.6 — 27B

ذكاء اصطناعي محلي / خاص Alibaba (Qwen Team) · تم الإصدار April 22, 2026
#2
8.3/10

أحدث نموذج كثيف بـ 27 مليار معامل من Alibaba لا يخلف ملك الذكاء الاصطناعي المحلي السابق فحسب — بل يتفوق على نموذجهم الرائد بـ 397 مليار معامل في كل معيار مهم للبرمجة الوكيلية مع التشغيل على معالج رسومي واحد للمستهلك. SWE-bench Verified 77.2، Terminal-Bench 2.0 59.3، رؤية وفيديو أصليان، ترخيص Apache 2.0.

يتفوق على Qwen3.5-397B-A17B (نموذج MoE بـ 397 مليار) في SWE-bench Verified (77.2)، SWE-bench Pro (53.5)، Terminal-Bench 2.0 (59.3) وSkillsBench Avg5 (48.2). GPQA Diamond 87.8. متعدد الوسائط أصلي مع حفظ التفكير. مجتمع r/LocalLLaMA يصفه بـ «أكبر إصدار في العام» و«نقطة تحول للاستدلال المحلي».

نفس ملف VRAM تقريباً مثل السلف (~17-20 جيجابايت في 4-بت)؛ جديد جداً لذا خيارات التكميم لا تزال تتوالى؛ وضع التفكير قد يكون مُسهباً في المهام البسيطة (قابل للتبديل).


Multimodal Open Weight Apache 2.0 Agentic Coding Vision + Video Free Offline

Kimi K2.6

ذكاء اصطناعي محلي / خاص Moonshot AI · تم الإصدار April 20, 2026
#3
8.2/10

وحش الأوزان المفتوحة ذو التريليون معامل من Moonshot AI — عملاق Mixture-of-Experts يُنشّط فقط 32 مليار معامل لكل رمز، لكنه يكتسح معايير البرمجة الوكيلية أكثر من معظم النماذج المغلقة. أوزان مفتوحة، مدخلات متعددة الوسائط، 256 ألف رمز سياق، وأسراب وكلاء تنسّق مئات الوكلاء الفرعيين. الحدود الأمامية أصبحت مفتوحة.

SWE-Bench Pro 58.6 (يتفوق على GPT-5.4 وClaude Opus 4.6)، Terminal-Bench 66.7، BrowseComp 83.2، HLE-Full مع أدوات 54.0. Artificial Analysis يصنّفه رقم 4 عالميًا — أعلى مرتبة يبلغها نموذج مفتوح. مدخلات بصرية متعددة الوسائط حيث كان GLM-5.1 نصيًا فقط.

تريليون معامل إجمالي يعني ~600+ غيغابايت VRAM حتى بتكميم INT4 — ليس نموذج حاسوب محمول. ستستخدمه عبر API ‏($0.95/مليون رمز إدخال) أو استضافة ذاتية على عناقيد GPU مؤسسية. اختبارات الواقع تُظهر فجوات صقل أحيانًا. استهلاك الرموز مرتفع في الجلسات الوكيلية الطويلة.


Open Weight MoE Multimodal Agentic Coding API

Gemma 4

ذكاء اصطناعي محلي / خاص Google DeepMind · تم الإصدار April 2, 2026
#4
8.1/10

ردّ جوجل على السؤال: «ماذا لو عمل ذكاء اصطناعي متقدّم على هاتفك؟» Gemma 4 ليس نموذجًا واحدًا — إنه عائلة من أربعة، من نموذج حافّة بملياري معامل يعمل في 1.5 غيغابايت من الذاكرة إلى نموذج كثيف بـ 31 مليار معامل. نموذجا E2B وE4B يجلبان الذكاء متعدد الوسائط — نصوص وصور وصوت — إلى الهواتف الذكية، بدون اتصال بالإنترنت.

E4B يحقق 42.5% في AIME 2026 — ضعف نموذج 27B من الجيل السابق. ترخيص Apache 2.0 كامل. إدخال صوتي أصلي في نماذج الحافة. دعم 140+ لغة. أربعة أحجام مختلفة تغطي كل سيناريو من Raspberry Pi إلى محطة العمل.

نماذج الحافة الأصغر (E2B، E4B) تفتقر لعمق الاستدلال الكامل لنماذج سطح المكتب. لا إدخال فيديو في نماذج الحافة (فقط 26B و31B). أدوات نظام جوجل مفضّلة — توافق أقل مع الأنظمة غير التابعة لجوجل.


Multimodal Open Weight Apache 2.0 On-Device Free

الأسئلة الشائعة

يوفر الذكاء الاصطناعي المحلي خصوصية كاملة (لا تغادر البيانات جهازك أبداً)، ويعمل دون اتصال بالإنترنت، ولا يتطلب تكاليف اشتراك متكررة، ويتجنب حدود قيود الاستخدام الخاصة بالواجهات البرمجية السحابية.

تحتاج إلى وحدة معالجة رسومات (GPU) جيدة بذاكرة فيديو كافية (VRAM) لا تقل عن 8-12 جيجابايت للنماذج الصغيرة مثل Llama 4 8B أو Gemma 4، و16-24 جيجابايت للنماذج الأكبر (مثل Qwen 3.6 27B أو Gemma 4 31B)، أو جهاز Mac بمعالجات Apple Silicon وذاكرة موحدة (16-48 جيجابايت أو أكثر). التشغيل باستخدام المعالج الرئيسي (CPU) فقط بطيء جداً.

تتضمن البرمجيات مفتوحة المصدر الحقيقية كود البرمجة ومجموعة بيانات التدريب. أما نماذج الأوزان المفتوحة (مثل DeepSeek وLlama وGemma) فتمنحك الأوزان المدربة مسبقاً لتشغيلها محلياً، ولكن تظل مجموعة بيانات التدريب الدقيقة ملكية خاصة للشركة.

الطريقة الأسهل هي استخدام تطبيقات مجانية للمستخدمين مثل Ollama أو LM Studio أو AnythingLLM. تتولى هذه التطبيقات تكوين الواجهة الخلفية المعقدة، مما يتيح لك تنزيل النماذج والدردشة معها في واجهة نظيفة بنقرة واحدة.