GLM-5.2
Zhipu AI · تم الإصدار 13 يونيو 2026
ما هو في الواقع
هناك رقم سهل التجاهل حتى ترى من أين جاء: 1360. هذا هو Elo لـ GLM-5.2 في Design Arena — ليس معياراً ذاتي الإبلاغ، بل قائمة مستقلة يصوت فيها مستخدمون حقيقيون على مهام حقيقية. إنه المركز الأول.
ثم هناك 87. درجة GLM-5.2 في معيار AkitaOnRails — قفزة +41 نقطة من GLM-5.1. من Tier C إلى Tier A. أكبر تحسن ضمن عائلة واحدة في تاريخ المعيار.
أُصدر في 13 يونيو 2026، GLM-5.2 هو نموذج MoE بـ 744 مليار معامل. SWE-bench Pro 62.1% يتفوق على GPT-5.5 (58.6%). Terminal-Bench 82.7 على Claude Code يتفوق على Opus 4.8 (78.9). FrontierSWE 74.4% — 1% خلف Opus 4.8. ترخيص MIT هو مضاعف القوة.
نقاط القوة الرئيسية
- Design Arena المركز 1 — Elo 1360: أول نموذج مفتوح يتصدر فئات البرمجة في Design Arena. تحقق مستقل من المجتمع.
- AkitaOnRails 87/100 — Tier A: أكبر تحسن في تاريخ المعيار. من 46/100 (Tier C) إلى 87/100 (Tier A) — +41 نقطة.
- SWE-bench Pro 62.1%: يتفوق على GPT-5.5 (58.6%) وكل النماذج المفتوحة. Verified subsets تظهر ~78%+.
- Terminal-Bench 82.7 (Claude Code): يتفوق على Opus 4.8 (78.9) على نفس الإطار. قفزة +17.5 نقطة من GLM-5.1.
- FrontierSWE 74.4%: 1% فقط خلف Opus 4.8. ترخيص MIT وسياق مليون رمز.
-
Design Arena — المركز 1 (Elo 1360) أول نموذج مفتوح يتصدر. تحقق مستقل من المجتمع. تفوق على Claude Fable 5.
-
SWE-bench Pro — 62.1% يتفوق على GPT-5.5 (58.6%) وكل النماذج المفتوحة. فقط Opus 4.8 (69.2%) أعلى.
-
Terminal-Bench 2.1 — 81.0 / 82.7 82.7 على Claude Code (يتفوق على Opus 4.8 بـ 78.9). +17.5 نقطة من GLM-5.1.
-
AkitaOnRails — 87/100 Tier A تقييم عملي متعدد الأدوار. +41 نقطة من GLM-5.1 — أكبر قفزة ضمن عائلة في التاريخ.
قيود صادقة
- فجوة في معايير العمق: Opus 4.8 يتصدر SWE-bench Pro (69.2 مقابل 62.1)، NL2Repo (69.7 مقابل 48.9)، SWE-Marathon (26.0 مقابل 13.0).
- بنية ثقيلة: 744 مليار معامل. إعدادات بمئات الجيجابايت مطلوبة.
- لا يهيمن على الدردشة العامة: lmarena Code Arena المركز 7-10. قوي في البرمجة.
- لا رؤية أصلية: نص/كود فقط.
الحكم: شيء ما تغير. عندما يأخذ نموذج مفتوح الأوزان المركز الأول في Design Arena، ويقفز 41 نقطة في معيار مستقل عملي، ويبقى بنسب مئوية من رقم واحد خلف أفضل نموذج مغلق في FrontierSWE — هذا ليس تقدماً تدريجياً. GLM-5.2 هو أقوى نموذج برمجة مفتوح أُصدر على الإطلاق.