البرمجة — ذكاء اصطناعي يكتب شيفرة إنتاجية

لقد تجاوزنا رسميًا المرحلة التي كانت فيها «الشيفرة المولَّدة بالذكاء الاصطناعي» تعني مجرد عروض توضيحية بسيطة. هذه النماذج الثلاثة تكتب شيفرة جاهزة للنشر — تخطط لإعادة هيكلة ملفات متعددة، وتحتفظ بمستودعات كاملة في الذاكرة، وتصحّح أخطاءها ذاتيًا عبر مهام طويلة. تخيّلها كفريق من كبار المهندسين لا يحتاجون استراحات قهوة وقد قرؤوا كل إجابة على Stack Overflow. المفارقة؟ تكلفتها تُشبه أجور كبار المهندسين أيضًا.

تصفية الكل النظام البيئي اليومي توليد الصور البرمجة منشئو التطبيقات البحث المهندسون الرقميون الموجهون الأكاديميون فيديو موسيقى وصوت ذكاء اصطناعي محلي / خاص وكلاء ذكاء اصطناعي

GPT-5.4 — Thinking

البرمجة

نموذج حدودي عام يتفوّق على المتخصصين في معايير البرمجة الأهم. تخيّل عشاريّاً أولمبياً يحمل أيضاً الرقم القياسي العالمي في سباق 100 متر.

SWE-Bench Pro 57.7% — نموذج عام يتجاوز GPT-5.3-Codex (56.8%). نافذة سياق بمليون رمز لتحميل مستودعات كاملة. توفير 47% من الرموز عبر أدوات أصلية. أسرع 1.5 مرة في Codex.

تكاليف API أعلى (2.50$/مليون إدخال، 15$/مليون إخراج). سياق المليون بالتكلفة المضاعفة في Codex. لا يزال Opus 4.6 ينتج شيفرة أكثر اتساقاً في إعادة الهيكلة الكبرى.


Coding Agentic Long Context Reasoning Paid Only API Web

Claude Opus 4.6

البرمجة

النموذج الذي يفكّر قبل أن يبرمج. يخطط Opus 4.6 لعمليات إعادة هيكلة متعددة الخطوات، ويحافظ على السياق عبر قواعد أكواد ممتدة، ويكتب كوداً إنتاجياً يبدو وكأن مهندساً خبيراً قد راجعه — لأنه فعلياً حدث شيء من هذا القبيل.

أقوى نماذج Anthropic. نافذة سياق بمليون رمز (تجريبية) تتيح الاحتفاظ بمستودعات كاملة في الذاكرة العاملة. درجات متقدمة في معايير البرمجة الوكيلية — يخطط وينفذ ويصحح ذاتياً عبر مهام طويلة.

الأغلى سعراً في فئته. يمكن أن تتضاعف التكلفة في الجلسات الوكيلية الطويلة بغياب إشراف — كما أنه أبطأ من النماذج الأخف للأسئلة السريعة.


Coding Agentic Long Context Paid Tier Web API

GLM-5.1

البرمجة

أول نموذج مفتوح الأوزان يحتل المركز الأول على SWE-Bench Pro — وبترخيص MIT. GLM-5.1 لا يكتب الأكواد فحسب؛ بل يُدير جلسات هندسية مستقلة لأكثر من 8 ساعات مع 655+ تكرارًا، مُصحّحًا نفسه عبر آلاف استدعاءات الأدوات. الردّ مفتوح المصدر على هيمنة النماذج المغلقة في البرمجة.

رقم قياسي على SWE-Bench Pro بـ 58.4 — متفوقًا على Claude Opus 4.6 ‏(57.3) وGPT-5.4 ‏(57.7). CyberGym 68.7 متفوقًا على جميع النماذج المغلقة. نافذة سياق 200 ألف مع 128 ألف+ مخرجات. أوزان مفتوحة بالكامل بترخيص MIT.

نصّي فقط — لا مدخلات مرئية أو متعددة الوسائط. حوالي 754 مليار معامل إجمالي يعني متطلبات GPU جدّية حتى مع 40 مليار معامل نشط MoE. أدوات المنظومة الغربية لا تزال أقل نضجًا من الموارد الصينية.


Open Weight MIT Agentic SWE-Bench SOTA Free