Claude Opus 4.6
By Anthropic · Updated
ما هو في الواقع
Opus 4.6 هو أكبر نماذج Anthropic وأكثرها قدرة — النموذج الذي يُستدعى حين تكون المشكلة أعقد من أن يتعامل معها Sonnet. إذا كان Sonnet 4.6 هو الزميل الذكي الذي يكتب شيفرة نظيفة، فإن Opus هو المهندس الرئيسي الذي يُعيد تصميم البنية المعمارية بالكامل. إنه لا يُكمل الدالّة التي تعمل عليها فحسب — بل يفهم لماذا وُجدت هذه الدالّة، وكيف ترتبط ببقية قاعدة الشيفرة، وما الذي ينبغي إعادة هيكلتها إليه. نهج «التفكير قبل البرمجة» حقيقي. يخطط Opus لعمليات إعادة هيكلة متعددة الخطوات، ويحافظ على السياق عبر قواعد شيفرة واسعة، وينتج شيفرة تبدو وكأن مهندسًا أقدم راجعها. حسّنته Anthropic تحديدًا لسير العمل الوكيلي (Agentic Workflows) — النوع الذي تقول فيه «نفّذ هذه الميزة» فيخطط ويكتب ويختبر ويُكرّر عبر ملفات متعددة دون أن يفقد الخيط.
نقاط القوة الرئيسية
- نافذة سياق بمليون رمز (Token) — تجريبية: أي ما يعادل تقريبًا 750,000 كلمة من الشيفرة والوثائق في جلسة واحدة. يمكنك تحميل مستودع أحادي (Monorepo) كامل وطرح أسئلة عبره.
- بطل البرمجة الوكيلية: أعلى الدرجات في معايير البرمجة الوكيلية — يخطط وينفّذ ويصحّح ذاتيًا عبر مهام طويلة دون فقدان الاتساق.
- جودة الشيفرة: ينتج باستمرار شيفرة مُنظّمة ومتوافقة مع الأنماط المعتمدة. يتبع الأنماط الموجودة في قاعدة شيفرتك بدلاً من فرض اصطلاحاته الخاصة.
- الاستدلال عبر ملفات متعددة: يفهم Opus كيف تتردد التغييرات في ملف واحد عبر المشروع بأكمله. يُحدّث الاختبارات والأنواع والواجهات عند تعديل التطبيق.
- التفكير الموسّع: للقرارات المعمارية الصعبة، يتيح وضع التفكير (Thinking Mode) الاستدلال عبر المفاضلات قبل الالتزام بتصميم معين.
- Arena Elo — 1,561 (المركز الأول في البرمجة)مقارنات عمياء جماعية على لوحة arena.ai للبرمجة. يحتل Opus 4.6 المركز الأول بين 45 نموذجًا — متقدمًا بفارق واضح على GPT-5.2 (المركز الخامس).
- SWE-bench Verified — %79.2مشكلات فعلية من GitHub في مستودعات إنتاجية. يتصدر Opus 4.6 مع وضع التفكير لوحة SWE-bench.
- Arena Elo — 1,505 (المركز الأول في النص)يحتل أيضًا المركز الأول في لوحة أداء النصوص العامة — ليس مجرد متخصص في البرمجة بل أفضل نموذج تقييمًا على الإطلاق.
قيود صادقة
- التكلفة: أغلى نموذج في فئته. جلسة وكيلية طويلة لمراجعة قاعدة شيفرة قد تكلف أكثر بكثير من Sonnet أو نماذج GPT المكافئة.
- السرعة: أبطأ من النماذج الأخف. إذا كنت تحتاج سطرًا برمجيًا سريعًا أو توقيع دالّة، فإن Opus مبالغة — كمن يستدعي جرّاحًا لوضع لصقة جرح.
- تضخم تكلفة العمل الوكيلي: قد تتصاعد تكاليف الجلسات المستقلة الطويلة إن لم تُشرف عليها. حدّد نقاط مراجعة وتفقّد ما غيّره.
الحكم: أفضل شريك برمجة بالذكاء الاصطناعي يمكن للمال شراؤه — وهو فعلاً يكلّف مالاً. استخدم Opus 4.6 لعمليات إعادة الهيكلة المعقدة وتنفيذ الميزات واسعة النطاق والقرارات المعمارية. واستخدم Sonnet لكل ما عدا ذلك. الفرق حقيقي، وفارق التكلفة كبير، ومطابقة النموذج للمهمة هو نصف المهارة.