Kimi K2.6

By Moonshot AI · Updated

الموقع الرسمي

ما هو في الواقع

إليك رقمًا ينبغي أن يُقلق كل مسؤول تنفيذي في مجال الذكاء الاصطناعي السحابي: 58.6. هذه نتيجة Kimi K2.6 على SWE-Bench Pro — المعيار الذي يقيس ما إذا كان الذكاء الاصطناعي يستطيع فعلاً إصلاح أخطاء حقيقية في قواعد أكواد حقيقية. يتفوق على 57.7 لـ GPT-5.4. يتفوق على 53.4 لـ Claude Opus 4.6. وعلى عكس هذين النموذجين، يمكنك تحميل الأوزان الكاملة وتشغيله بنفسك.

صدر من Moonshot AI في 20 أبريل 2026، Kimi K2.6 هو نموذج Mixture-of-Experts بتريليون معامل يُنشّط فقط 32 مليارًا لكل تمريرة. تخيّل شركة بـ 384 قسمًا متخصصًا — لكل سؤال، 8 خبراء فقط يجتمعون للإجابة بينما البقية في وضع الاستعداد. النتيجة: ذكاء على مستوى الحدود الأمامية بجزء من تكلفة الحوسبة لكل رمز.

لكن ما يجعل K2.6 مختلفًا حقًا عن أبطال الأوزان المفتوحة السابقين ليس الحجم — بل ما يستطيع فعله. ينسّق أسراب وكلاء تصل إلى 300 وكيل فرعي عبر 4,000+ خطوة منسّقة. يعالج الصور والفيديو أصلاً. يتعامل مع 256 ألف رمز سياق دون تدهور. وعلى مؤشر الذكاء الشامل من Artificial Analysis، يسجّل 54 — المركز الرابع عالميًا، خلف أكبر ثلاثة نماذج مغلقة فقط. لم يكن أي نموذج مفتوح بهذا القرب من القمة من قبل.

نقاط القوة الرئيسية

  • اكتساح المعايير الوكيلية: SWE-Bench Pro 58.6، Terminal-Bench 66.7، BrowseComp 83.2، Toolathlon 50.0 — لا يُنافس النماذج المغلقة فحسب، بل يتفوق عليها. أول نموذج مفتوح يتصدر معايير الهندسة الحقيقية باستمرار.
  • مدخلات متعددة الوسائط حقيقية: يعالج الصور والفيديو أصلاً إلى جانب النص والكود. تحليل لقطات الشاشة، تصحيح التخطيطات البصرية، فهم المخططات — ميزة حاسمة على المنافسين النصيين فقط مثل GLM-5.1.
  • تنسيق أسراب الوكلاء: يدعم حتى 300 وكيل فرعي ينفّذون 4,000+ خطوة منسّقة. لا يجيب على الأسئلة فحسب — بل ينسّق سير عمل مستقل كاملة، من البحث المعمّق إلى إعادة هيكلة الكود متعدد الملفات.
  • نافذة سياق 256 ألف: أدخل قواعد أكواد كاملة، مجموعات توثيق ضخمة، أو سجلات محادثات متعددة الساعات. مع نتيجة LiveCodeBench v6 البالغة 89.6، يتعامل مع مهام البرمجة المعقدة طويلة المدى بثبات ملحوظ.
  • أوزان مفتوحة، ترخيص MIT معدّل: حمّل الأوزان الكاملة من Hugging Face واستضف ذاتيًا. قابل للاستخدام التجاري مع شرط إسناد بسيط للنشر الكبير جدًا (100 مليون+ مستخدم نشط شهريًا). بلا رسوم ملكية، بلا قيود API.
لمحة عن المعايير
  • SWE-Bench Pro — 58.6معيار هندسة البرمجيات الحقيقية. يتفوق على GPT-5.4 ‏(57.7) وClaude Opus 4.6 ‏(53.4). أعلى نتيجة يحققها نموذج مفتوح الأوزان على هذا المعيار.
  • Artificial Analysis — رقم 4 عالميًا (مؤشر 54)النموذج المفتوح الرائد على مؤشر الذكاء AA، خلف ثلاثة نماذج مغلقة فقط (Anthropic، Google، OpenAI عند 57). معدل الهلوسة انخفض إلى 39% من 65% لـ K2.5.
  • البنية — 1T MoE / 32B نشط384 خبيرًا مع Multi-head Latent Attention. 32 مليار معامل نشط لكل رمز فقط. يدعم vLLM وSGLang وKTransformers.

قيود صادقة

  • ليس لبطاقات المستهلك: تريليون معامل يعني ~600–650 غيغابايت VRAM بتكميم INT4. تحتاج عناقيد GPU مؤسسية (عدة H100) للاستضافة الذاتية. معظم المستخدمين سيصلون عبر API — مما يُلغي جزءًا من وعد الخصوصية المحلية.
  • فجوات صقل أحيانًا: أرقام المعايير مذهلة، لكن اختبارات vibe-coding الواقعية تُبلغ عن عناصر واجهة معطّلة وخشونة تتعامل معها النماذج المغلقة مثل Claude بأناقة أكبر.
  • استهلاك رموز مرتفع: وضع التفكير/الاستدلال يحرق الرموز بسرعة في الجلسات الطويلة. احتاج Artificial Analysis ~160 مليون رمز استدلال لمعياره الكامل — راقب تكاليف API.
  • انحياز المنظومة الصينية: كنماذج أخرى صينية المنشأ، التوثيق الإنجليزي وأدوات المجتمع الغربي تنمو لكنها أقل نضجًا من المنظومة الصينية.

الحكم: أقوى نموذج مفتوح الأوزان صدر على الإطلاق. إذا كنت تهتم بالبرمجة على مستوى الحدود الأمامية، وسير العمل الوكيلي، والفهم متعدد الوسائط دون الارتباط بمزوّد سحابي واحد، فإن Kimi K2.6 يجعل ذلك ممكنًا. القيد صريح: لن تشغّله على حاسوبك المحمول. لكن يمكنك استضافته ذاتيًا على عتاد جدّي، أو استخدامه عبر نقاط API رخيصة بشكل لا يُصدّق. في كلتا الحالتين، حدود الأوزان المفتوحة قفزت للتو.