الجميع يتحولون من ChatGPT إلى Claude — لكن اختبارات جديدة تشير إلى أن لا أحد منهما هو أذكى ذكاء اصطناعي مجاني، وربما يكون الفائز الحقيقي مفاجأة لك

اختبار من OmniCalculator يبرز أن كلود وChatGPT ليسا الأذكى.. لكن من يتفوق في المنطق وحل المشكلات؟

كشف تقرير حديث من OmniCalculator أن نموذج Grok 4.2 من xAI يتفوق على غيره من نماذج الذكاء الاصطناعي المجانية في القدرة على التعامل مع المسائل الرياضية والمنطقية، ما يجعله الأكثر ذكاءً من ناحية المهارات الحسابية. ومع ذلك، فإن هذا لا يعني أنه يتفوق في جودة الكتابة أو القدرات الأخرى التي تتميز بها نماذج الذكاء الاصطناعي.

تفوق Grok في القدرات الحسابية والمنطقية

على الرغم من أن الذكاء الاصطناعي يُقاس غالبًا بمستوى قدرته على إنتاج نصوص عالية الجودة، أظهر التقرير أن Grok 4.2 هو الأفضل في حل المشكلات المنطقية والرياضيات. بالمقابل، تظل نماذج مثل كلود وChatGPT تتنافس في مجالات أخرى، خاصة في جودة الكتابة والتواصل.

كلود تتفوق في جودة الكتابة والتواصل

يُعَتبَّر كلود 4.6 الأفضل في كيفية صياغة الردود والتعامل مع المستندات الطويلة، حيث يستطيع معالجة النصوص بشكل متماسك دون فقدان التناسق أو الصوت المميز. يُلاحظ أن المستخدمين يفضلون هذا الأسلوب لأنه يمنحهم إجابات أكثر توازناً وواقعية، خاصة في الاعتراف بعدم اليقين، مما يضفي على الردود طابع التفكير العميق.

الاستقرار والثبات في الأداء

أظهرت الدراسات أن النماذج الأقدم من ChatGPT وكلود كانت تميل إلى مراجعة أو تعديل إجاباتها في حوالي 60% من الحالات عند التعامل مع مسائل معقدة. لكن، مع إصدار Grok 4.2، انخفضت هذه النسبة إلى 33.1%، مما يعني أن النموذج أكثر استقرارًا وثباتًا في نتائج استنتاجاته، وهو أمر مهم جدًا في عمليات التفكير المنطقي وحل المشكلات.

الاختلافات بين النماذج وأهمية التخصص

لا يمكن اعتبار نموذج واحد هو الأذكى بشكل مطلق. فكل نموذج يمتلك نقاط قوة وضعف، ويُفضل الاعتماد على أحدها وفقًا للمهمة المطلوبة. فمثلاً، قد يكون النموذج الأفضل في كتابة البريد الإلكتروني ليس هو الأمثل لحل مشكلة تقنية معقدة.

ومع تزايد المنافسة، من المتوقع أن تركز الشركات على تحسين قدراتها المتخصصة بدلًا من السعي وراء نموذج شامل ومتعدد المهام. لذلك، فإن السؤال عن “أي الذكاء الاصطناعي هو الأذكى” غالبًا ما يعتمد على السياق والاحتياج.

الخلاصة

الذكاء الاصطناعي يتطور بسرعة، وتظل الاختيارات مبنية على المهمة المحددة. على الرغم من أن Grok 4.2 يتفوق في المنطق وحل المشكلات، تظل نماذج مثل كلود وChatGPT متميزة في جودة الكتابة والتفاعل. في النهاية، لا يوجد نموذج واحد يتفوق في كل شيء، وسيظل الاعتماد على الأداة الأنسب للمهمة هو الأهم دائمًا.

المصدر: Latest from TechRadar

الجميع يتحولون من ChatGPT إلى Claude — لكن اختبارات جديدة تشير إلى أن لا أحد منهما هو أذكى ذكاء اصطناعي مجاني، وربما يكون الفائز الحقيقي مفاجأة لك

اترك تعليقاً إلغاء الرد

هل أنت مستعد لتكون قصة نجاحنا القادمة؟

الجميع يتحولون من ChatGPT إلى Claude — لكن اختبارات جديدة تشير إلى أن لا أحد منهما هو أذكى ذكاء اصطناعي مجاني، وربما يكون الفائز الحقيقي مفاجأة لك

اترك تعليقاً إلغاء الرد

إليك المقال المعاد صياغته باللغة العربية: ملاحظات وإجابات لعبة “ستراندس” من نيويورك تايمز ليوم الأحد، ٣١ مايو (اللغز رقم ٨١٩)

تلميحات وأجوبة لعبة كوردل ليوم الأحد، ٣١ مايو (الرقم ١٥٨٨)

لم أكن مقتنعًا بأن ماوس Logitech G Pro X2 Superstrike سيكون مميزًا جدًا، ولكنني كنت مخطئًا: إنه ثورة في عالم فئرة الألعاب.

هل أنت مستعد لتكون قصة نجاحنا القادمة؟