GPT-5.5 هو أحدث وأقوى نموذج ذكاء اصطناعي ذو قدرة عالية من OpenAI حتى الآن.

أطلقت شركة OpenAI إصدار GPT-5.5 في 23 أبريل، والذي تصفه بأنه “فئة جديدة من الذكاء الاصطناعي للعمل الحقيقي وتفعيل الوكلاء”. ويهدف هذا الإصدار إلى توضيح قدراته بشكل واضح، حيث تقول الشركة إنه يُعدّ أقوى نموذج ذكاء اصطناعي يمتلك قدرات وكيلة، صُنع خصيصًا ليخطط، ويستخدم الأدوات، ويفحص مخرجاته، ويعمل بشكل مستقل على إنجاز المهام.

ويُعتبر GPT-5.5 أول نموذج أساسي يتم إعادة تدريبه منذ إصدار GPT-4.5، وهو مبني بالتعاون مع أنظمة NVIDIA GB200 وGB300 NVL72، التي تُستخدم على نطاق واسع في الخوادم. وتوضح الشركة أن الفرق العملي يكمن في أن المهام التي كانت تتطلب سابقًا عدة مطالبات وتصحيحات بشرية يمكن الآن أن تُنجز بشكل أكثر تكاملاً عند استخدام GPT-5.5. يتوفر النموذج لمستخدمي ChatGPT من فئات Plus وPro وBusiness وEnterprise، بالإضافة إلى Codex، وتم إطلاق الوصول عبر واجهة برمجة التطبيقات (API) في 24 أبريل.

الاختبارات والأداء

تُبرز OpenAI أن أداؤها الأكثر قوة كان على معيار Terminal-Bench 2.0، وهو اختبار يقيس قدرات تنفيذ أوامر سطر الأوامر التي تتطلب التنسيق مع أدوات مختلفة ضمن بيئة معزولة. حقق GPT-5.5 نسبة نجاح بلغت 82.7%، متفوقًا على GPT-5.4 الذي حقق 75.1%، وClaude Opus 4.7 الذي سجل 69.4%.

وفي اختبار SWE-Bench Pro، الذي يقيم قدرة النموذج على حل مشاكل GitHub، وصل GPT-5.5 إلى نسبة 58.6%، مما يتيح حل المزيد من المشكلات من خلال تمريرة واحدة مقارنة بالإصدارات السابقة. كما أطلقت OpenAI اختبار Expert-SWE، وهو معيار داخلي يقيم أداء النموذج في مهام يُقدّر أن يتطلب إنجازها من قبل الإنسان حوالي 20 ساعة. وقد حقق GPT-5.5 نسبة 73.1%، مقابل 68.5% لنموذج GPT-5.4.

وفي اختبار التفكير في سياق طويل، والذي يقيم قدرة النموذج على استرجاع إجابة محددة من مستند ضخم يتجاوز مليون رمز، حقق GPT-5.5 نسبة 74.0%، مقابل 36.6% لنموذج GPT-5.4.

ومع ذلك، لم يُسجل النموذج على اختبار MCP Atlas، وهو معيار يستخدم أداة بروتوكول سياق النموذج من Scale AI، حيث تفوق Claude Opus 4.7 بنسبة 79.1%. أدرجت OpenAI غياب النتيجة الخاصة بـGPT-5.5 في جدول الاختبارات الخاص بها، وهو ما يُعطي إشارات على ثقتها في الصورة العامة لأدائه.

الكفاءة والتكلفة

بالنسبة للكفاءة في استهلاك الرموز، فإن الوصول إلى API يُكلَّف 5 دولارات لكل مليون رمز إدخال و30 دولارًا لكل مليون رمز إخراج، وهو ضعف السعر الذي كانت عليه GPT-5.4. وتوضح OpenAI أن GPT-5.5 يُنجز مهام Codex باستخدام رموز أقل من GPT-5.4، مما يجعل التكاليف الفعالة أعلى بنسبة حوالي 20% عند احتساب الكفاءة، وهو ما أكدته مختبرات تحليل مستقلة مثل Artificial Analysis.

أما بالنسبة لنسخة GPT-5.5 Pro، المتاحة لمستخدمي Pro وBusiness وEnterprise، فالسعر هو 30 دولارًا لكل مليون رمز إدخال و180 دولارًا لكل مليون رمز إخراج. وتوفر هذه النسخة قدرات إضافية لمعالجة المهام الصعبة، وتتفوق بنسبة 90.1% في اختبار BrowseComp، وهو معيار تصفح الويب الذي أطلقته OpenAI والذي يقيس قدرات الوكيل على تصفح الإنترنت.

التطبيقات العملية والتوقعات المستقبلية

تؤكد OpenAI أن أكثر من 85% من الموظفين يستخدمون Codex أسبوعيًا في أقسامهم، بما في ذلك الهندسة والتسويق. على سبيل المثال، استخدمت فريق الاتصالات GPT-5.5 لتحليل بيانات طلبات التحدث على مدى ستة أشهر، حيث استطاع النموذج بناء إطار لتقييم المخاطر والموافقة الآلية على الطلبات ذات المخاطر المنخفضة.

وصف جريج بروكمان إصدار GPT-5.5 بأنه “خطوة حقيقية نحو نوعية الحوسبة التي نتوقعها في المستقبل”، مشيرًا إلى أن العالم العلمي جيكوب باشوكي لاحظ أن التقدم في النماذج خلال العامين الماضيين كان “مفاجئًا ببطئه”. وتقول OpenAI إن GPT-5.5 يطابق زمن الاستجابة لكل رمز من GPT-5.4 أثناء الخدمة في الإنتاج، مع أداء أعلى من حيث مستوى الذكاء، مع تجنب التباطؤ الذي يصاحب عادة النماذج الأكبر والأكثر قدرة.

الختام والتطلعات

السؤال الأهم هو ما إذا كانت النتائج على مقاييس الاختبارات ستتحول إلى تحسينات ملموسة في العمليات الحقيقية التي تعتمد على أنظمة الوكلاء الذكية. يُعد أداء Terminal-Bench واختبار MCP Atlas مؤشرين واعدين، خاصة فيما يتعلق بأتمتة عمليات DevOps واستخدام الأدوات بشكل أكثر كفاءة.

لمزيد من المعلومات حول الذكاء الاصطناعي والبيانات الكبيرة، يمكنك حضور فعاليات مثل معرض AI & Big Data الذي يُقام في أمستردام و كاليفورنيا ولندن، والذي يُعد منصة تجمع بين الخبراء والمهتمين بآخر التطورات في المجال.

المصدر: AI News

GPT-5.5 هو أحدث وأقوى نموذج ذكاء اصطناعي ذو قدرة عالية من OpenAI حتى الآن.

اترك تعليقاً إلغاء الرد

هل أنت مستعد لتكون قصة نجاحنا القادمة؟

GPT-5.5 هو أحدث وأقوى نموذج ذكاء اصطناعي ذو قدرة عالية من OpenAI حتى الآن.

اترك تعليقاً إلغاء الرد

إليك المقال المعاد صياغته باللغة العربية: ملاحظات وإجابات لعبة “ستراندس” من نيويورك تايمز ليوم الأحد، ٣١ مايو (اللغز رقم ٨١٩)

تلميحات وأجوبة لعبة كوردل ليوم الأحد، ٣١ مايو (الرقم ١٥٨٨)

لم أكن مقتنعًا بأن ماوس Logitech G Pro X2 Superstrike سيكون مميزًا جدًا، ولكنني كنت مخطئًا: إنه ثورة في عالم فئرة الألعاب.

هل أنت مستعد لتكون قصة نجاحنا القادمة؟