ChatGPT — GPT‑5.4 Thinking

By OpenAI · Updated

ما هو في الواقع

إذا كان تاريخ الذكاء الاصطناعي فرقة روك، فإن ChatGPT هو فرقة The Beatles — ليس بالضرورة الأكثر تعقيداً تقنياً في كل لحظة، لكنه الذي غيّر توقعات الجميع. GPT-5.4 Thinking هو النموذج الرائد الجديد من OpenAI: نموذج حدودي موحّد يفكّر قبل أن يجيب. يضمّ ثلاثة مستويات — فوري للإجابات السريعة، وThinking للمسائل التي تستحق التأنّي، وPro للمهام التي كنت ستستعين فيها بمستشار. الفارق الجوهري عن GPT-5.2؟ ثلاثة أمور: نافذة سياق بمليون رمز (Token) تسمح بتحميل مستودع كامل أو تقرير سنوي في جلسة واحدة، وانخفاض بنسبة 33% في الهلوسة (أي مرة أقل من كل ثلاث)، وأداء GDPval بلغ 83.0% عبر 44 مهنة — وهي النتيجة الأعلى على الإطلاق لتقييم القيمة الاقتصادية الواقعية للنماذج اللغوية.

نقاط القوة الرئيسية

استدلال حقيقي وليس تخميناً: GPQA Diamond 92.8% وOSWorld 75.0% — مقاييس صُمّمت لتحدي خبراء الدكتوراه وأتمتة واجهة المستخدم. النموذج يفكّر فعلاً ولا يطابق أنماطاً فحسب.
توفير 47% من الرموز: استخدام الأدوات الأصلية يخفض تكاليف API بنحو النصف مقارنة بنماذج GPT السابقة — وهذا فرق كبير للمطورين.
ذاكرة مستمرة: يتذكّر تفضيلاتك ومشاريعك عبر الجلسات. أخبره مرة أنك تفضل النقاط المختصرة وسيلتزم بذلك.
محرر Canvas: محرر مستندات جنباً إلى جنب للكتابة والتعديل المشترك للنصوص والأكواد دون فقدان سياق المحادثة.
اتساع المنظومة: ويب وiOS وAndroid وسطح المكتب وAPI. ومكتبة وكلاء GPTs المخصصين توسّعه لمهام متخصصة لا نهاية لها.

لمحة عن المعايير

GDPval — 83.0% (44 مهنة)مقياس القيمة الاقتصادية الواقعية للذكاء الاصطناعي. النتيجة الأعلى بين جميع النماذج — يعني أن النموذج ينتج عملاً مكافئاً لعمل محترف.
جداول البيانات — 87.3%إنجاز مهام معقدة في جداول البيانات (مقابل 68.4% لـ GPT-5.2). قفزة ضخمة في الإنتاجية المكتبية اليومية.
GPQA Diamond — 92.8%اختبار علمي بمستوى الدكتوراه. أعلى نتيجة مسجلة — يتفوق على كل النماذج المنافسة.
هلوسة أقل 33%انخفاض ملموس في الأخطاء الوقائعية مقارنة بـ GPT-5.2 — يعني موثوقية أعلى في المهام الحساسة.

قيود صادقة

مستوى Pro مكلف: الاشتراك Pro (200$/شهرياً) ضروري للوصول الكامل إلى وضع Thinking المطوّل ونافذة المليون رمز. الطبقة المجانية محدودة.
تبديل النماذج: أوقفت OpenAI عدة نماذج سابقة — محادثاتك القديمة قد تُنتج نتائج مختلفة مع النموذج الجديد.
نافذة السياق الكامل مكلفة: المليون رمز تُحسب بضعف التكلفة في بعض نقاط API. راقب استهلاكك.

الحكم: لم يعد مجرد الخيار الافتراضي — أصبح الأذكى في الغرفة. GPT-5.4 Thinking يجمع بين فائدة ChatGPT العملية وقدرة استدلالية تنافس الخبراء. إن كنت ستشترك في أداة ذكاء اصطناعي واحدة فقط، فهذا هو الخيار الذي يفعل كل شيء — لكن توقّع أن تدفع ثمن هذا التميز.