Claude — Opus 4.8
Anthropic · تم الإصدار May 28, 2026
ما هو في الواقع
إذا كان ChatGPT هو المنبسط في الحفلة وGemini هو الذي يقرأ في الزاوية، فإن Claude Opus 4.8 هو الشخص الهادئ البليغ الذي يستمع فعلاً لما تقوله — والذي يخبرك الآن أيضاً بصدق عندما لا يكون متأكداً من شيء. هذا الجزء الثاني جديد، وهو يهم أكثر من أي رقم معياري.
أحدث نموذج رئيسي من Anthropic لا يعالج المعلومات فحسب — بل يعالجها بنزاهة. Opus 4.8 أقل احتمالاً بـ 4 مرات لاختلاق “انتهيت” واثقة عندما لم ينتهِ فعلاً. يشير إلى الشكوك بشكل استباقي. يعترض على الافتراضات الخاطئة بدلاً من تنفيذها بسرور. في عالم يدّعي فيه كل نموذج ذكاء اصطناعي أنه الأفضل، يتميز هذا النموذج بالاستعداد للاعتراف عندما لا يكون متأكداً.
التحسينات التقنية حقيقية أيضاً. Dynamic Workflows تتيح لوكيل Opus قائد إطلاق مئات الوكلاء الفرعيين المتوازيين — واحد يحلل الماليات، وآخر يراجع البنود القانونية، وثالث يصيغ الملخص، كل ذلك مع نقاط تحقق حتى لا يضيع شيء. التحكم بالجهد يعني أنك أخيراً تختار العمق: إجابة سريعة أو تحليل شامل أو بحث معمّق. ونافذة السياق ذات المليون رمز لا تحتفظ فقط بمستنداتك — بل تستدل عبرها دون مشاكل “الضياع في المنتصف” التي ظهرت في 4.7.
المقابل؟ لا يزال نفسه. تدفع ثمن هذه الجودة. بينما المستوى المجاني لـ ChatGPT سخي وGemini مضمّن مع اشتراكك في جوجل، المستوى المجاني لـ Claude محدود. تجربة Opus الحقيقية تبدأ من 20 دولار/شهر وتصل إلى 200 دولار/شهر. لكن للمهنيين الذين يفوتّرون بالساعة ويحتاجون إجابات يمكنهم الوثوق بها فعلاً — الحساب لم يتغير. لا يزال بسيطاً.
نقاط القوة الرئيسية
- صدق قابل للقياس فعلاً: Opus 4.8 أقل احتمالاً بـ 4 مرات لاختلاق ادعاءات إنجاز. يشير إلى الشكوك بشكل استباقي، ويعترض على الافتراضات الخاطئة، ويقول ‘لا أعرف’ عندما تكون هذه الإجابة الصادقة. ليس ادعاء تسويقي — إنه أكبر قفزة نوعية عن 4.6 و4.7.
- نافذة سياق مليون رمز: 750,000 كلمة — عشر روايات أو قاعدة أكواد كاملة أو ملاحظات فصل دراسي كامل — في محادثة واحدة. وعلى عكس 4.7، لا تتدهور جودة السياق بشكل ملحوظ في النطاقات المتوسطة.
- Dynamic Workflows: وكيل Opus قائد يطلق ويدير مئات الوكلاء الفرعيين المتوازيين للمهام الضخمة — مسوحات بحثية، تحليل مستندات، مراجعات أكواد. إدارة مشاريع بالذكاء الاصطناعي مع نقاط تحقق للعمليات طويلة الأمد.
- التحكم بالجهد: اختر Default (إجابات سريعة) أو Extra (تحليل شامل) أو Max (بحث معمّق). لا مزيد من التفكير بمقاس واحد. الوضع السريع يوفر 2.5× السرعة بتكلفة أقل بـ 3× للمهام الأخف.
- موثوقية وكيلية من الطراز الأول: 100% إنجاز على Super-Agent. 83.4% على Online-Mind2Web (وكيل متصفح). أول نموذج يتجاوز 10% all-pass على Legal Agent Benchmark. عندما تسلّمه مهمة معقدة وتغادر، ينهيها فعلاً.
-
Knowledge Work — 1,890 (من 1,753) معيار داخلي يقيس التحليل المهني والتوليف وجودة الكتابة. تحسن بنسبة 7.8% عن Opus 4.7 — نوع المكاسب الذي يظهر في العمل اليومي الحقيقي.
-
Online-Mind2Web — 83.4% (وكيل متصفح رقم 1) مهام وكيل قائمة على المتصفح. Opus 4.8 يتفوق على كل من Opus 4.7 (82.8%) وGPT-5.5. أقوى نموذج لاستخدام الحاسوب ووكيل المتصفح تم اختباره.
-
Legal Agent Benchmark — أول من يتجاوز 10% عمل قانوني جوهري بمعيار all-pass. مكاسب الدقة تترجم مباشرة إلى مقدار العمل القانوني الحقيقي الذي يمكن للعملاء تفويضه بثقة.
قيود صادقة
- أسعار متميزة: Pro بـ 20 $/شهر، Max بـ 100–200 $/شهر. API: 5 $ إدخال / 25 $ إخراج لكل مليون رمز. التخزين المؤقت للأوامر يساعد (حتى 90% خصم)، لكن الاستخدام المكثف يتراكم سريعاً.
- لا توليد صور أصلي: على عكس ChatGPT وGemini، لا يستطيع Claude إنشاء صور. يحللها ببراعة، لكن إن احتجت صورة فأنت بحاجة لأداة أخرى.
- منظومة أصغر: تكاملات أقل، لا متجر إضافات، ومستوى مجاني أكثر محدودية مقارنة بـ ChatGPT. Claude في Microsoft 365 يتوسع لكنه ليس شاملاً بعد.
- استهلاك رموز في المهام العميقة: التفكير الأعمق الذي يجعل Opus 4.8 أكثر موثوقية يعني أيضاً رموزاً أكثر لكل محادثة في العمل المعقد. الوضع السريع يخفف هذا للمهام الأبسط، لكن توقع تكاليف أعلى في جلسات البحث المكثفة.
الحكم: إذا كان Opus 4.6 هو المحترف الهادئ الذي تستقر عليه، فإن Opus 4.8 هو ذلك المحترف نفسه بعد ترقية. كل ما جعل Claude خيار الخبراء لا يزال هنا — الفهم القرائي وجودة الكتابة وسياق المليون رمز. لكنه الآن أيضاً صادق حول ما لا يعرفه، وأكثر حدة في حكمه، وقادر على تشغيل سير عمل مستقل طويل دون مراجعات مستمرة. المقابل لم يتغير: تدفع متميزاً لجودة متميزة. لكن لأي شخص يتضمن عمله مستندات طويلة أو تحليلاً دقيقاً أو قرارات تهم فعلاً — هذا هو النموذج الذي يعمل أفضل عندما يهم العمل أكثر.