GPT‑5.5

OpenAI · تم الإصدار April 23, 2026

9.9 /10 التقييم العام

ما هو في الواقع

إذا كان تاريخ الذكاء الاصطناعي فرقة روك، فإن ChatGPT هو فرقة The Beatles — ليس بالضرورة الأكثر تعقيداً تقنياً في كل لحظة، لكنه الذي غيّر توقعات الجميع. GPT-5.5 هو الألبوم الذي تتوقف فيه الفرقة عن عزف أغاني الآخرين وتبدأ بتأليف سمفونيات. لا يكتفي بالإجابة — بل يخطط وينفّذ ويستخدم أدوات ويراجع عمله ويستمر حتى تُنجَز المهمة فعلاً.

تخيّل ترقية من مساعد ذكي جداً إلى زميل ذكي جداً لا ينسى أي مهمة. GPT-5.5 يخطط لمشاكل متعددة الخطوات، يستخدم أدوات بشكل مستقل، يشغّل حاسوبك عند الحاجة، وينفّذ مسارات عمل كانت تتطلب سابقاً نماذج متعددة وتنسيقاً يدوياً. يقرأ ويكتب ويولّد صوراً ويتصفح الويب وينفّذ شيفرة — ويفعل كل ذلك بـ 40% رموز أقل. كما قال إيثان موليك: “يبني بالضبط ما أطلبه.”

نقاط القوة الرئيسية

هيمنة GDPval (84.9%): اختُبر عبر 44 مهنة واقعية — تحليل قانوني، نمذجة مالية، دعم عملاء، علم بيانات — GPT-5.5 يتفوق على 83.0% لـ GPT-5.4 و80.3% لـ Opus 4.7. هذا يقيس ما إذا كان النموذج يساعد المهنيين فعلاً في إنجاز عملهم.
تنفيذ وكيلي يعمل فعلاً: يخطط لمهام متعددة الخطوات، يستخدم أدوات بمفرده، يراجع مخرجاته ويستمر حتى إتمام المهمة. OSWorld-Verified 78.7% (كان 75.0%) — يتنقل في سطح مكتبك أفضل من معظم المتدربين.
40% رموز إخراج أقل: نفس زمن الاستجابة كـ GPT-5.4، لكنه يعبّر بكفاءة أعلى. التكلفة الفعلية لكل مهمة تنخفض رغم مضاعفة سعر الرمز — المعادلة تنجح للمستخدمين المكثفين.
Tau2-Bench Telecom 98.0%: سير عمل وكيل خدمة عملاء معقد يُكمَل بشكل شبه مثالي. المعيار الذي يثبت أن وصف ‘وكيل’ ليس مجرد تسويق.
اتساع المنظومة: متاح على الويب وiOS وAndroid وتطبيقات سطح المكتب وعبر API. وكلاء GPTs مخصصين، تكامل Codex، ذاكرة مستمرة، Canvas، توليد صور — كل ما تستخدمه بالفعل، مدعوماً الآن بعقل يُنجز فعلاً.

لمحة عن المعايير

GDPval — 84.9% أداء مهني واقعي عبر 44 مهنة. يتفوق على GPT-5.4 (83.0%) وOpus 4.7 (80.3%) وGemini 3.1 Pro (67.3%) بشكل حاسم.
Artificial Analysis — #1 مؤشر ذكاء بدرجة 60 — 3 نقاط فوق التعادل الثلاثي السابق. أوسع معيار مركّب مستقل.
OSWorld-Verified — 78.7% معيار استخدام الحاسوب حيث يشغّل النموذج تطبيقات سطح المكتب تلقائياً. ارتفع من 75.0% لـ GPT-5.4.
Tau2-Bench — 98.0% سير عمل وكيل خدمة عملاء معقد يُكمَل بشكل شبه مثالي. يثبت القدرة الوكيلية في المهام التجارية المنظمة.

قيود صادقة

قفزة سعرية: تكاليف API تتضاعف إلى 5$/مليون إدخال و30$/مليون إخراج. المستوى Pro أعلى. كفاءة الـ 40% في الرموز تعوّض للمستخدمين المكثفين، لكن المستخدمين العاديين سيشعرون بالفاتورة.
تحفّظ بشأن الهلوسة: تقرير مستقل مبكر أشار إلى معدلات هلوسة مرتفعة في تقييمات معينة. OpenAI تدّعي حكماً أفضل عبر الاستدلال، لكن عالج العمل الحساس (قانوني، طبي، مالي) بطبقات تحقق.
API غير متاحة بعد: عند الإطلاق، GPT-5.5 في ChatGPT وCodex فقط. وصول API قادم ‘قريباً جداً’ — إن كنت تبني على API، فأنت تنتظر.
حواجز أمان مشددة: أقوى نظام أمان أطلقته OpenAI. معظم المستخدمين لن يلاحظوا، لكن المستخدمين المتقدمين في الحالات الحدّية سيواجهون رفضاً أحياناً.

الحكم: العصر الوكيلي يحصل على بطله الأوضح. GPT-5.5 لا يُكرر GPT-5.4 فحسب — بل يعيد تعريف معنى ‘جيد بما يكفي لتسليم العمل’. تقدُّم GDPval والمرتبة الأولى في Artificial Analysis والكمال شبه التام في Tau2-Bench يجعله ذكاء اصطناعياً يومياً يستحق أخيراً كلمة ‘زميل’. يكلف أكثر لكل رمز — لكنه ينجز عملاً أكثر لكل دولار. إن كنت ستشترك في ذكاء اصطناعي واحد عام 2026، فهذا هو الذي يوصل العمل المعقد والغامض إلى خط النهاية بأقل إشراف.