تتطور نماذج الذكاء الاصطناعي بشكل ملحوظ في مجالات اللغات النادرة، حيث تُظهر قدرات قوية في التعامل مع لغات قليلة البيانات بفضل تقنيات النقل بين اللغات. تساعد هذه التقنيات على مشاركة الأنماط اللغوية عبر مختلف اللغات، مما يعزز أداء النماذج في اللغات التي كانت تعتبر صعبة من قبل.
وفقًا لدراسة أعدتها شركة RWS حول توليد البيانات الاصطناعية لنماذج اللغة المتعددة اللغات، حققت منصة جيميني برو من جوجل نتائج عالية الجودة تفوق 4.5 من أصل 5 في اللغة الكينية، التي يتحدث بها حوالي 12 مليون شخص في رواندا وأوغندا والكونغو الديمقراطية. وقال فاساغي كوثانداباني، الرئيس التنفيذي لشركة TrainAI التابعة لـ RWS،: “هذه الدراسة تمثل لحظة تحول مهمة، ليست لإحلال الخبرة البشرية، بل لتعزيزها باستخدام التكنولوجيا المناسبة.”
تذليل حواجز اللغة عبر الذكاء الاصطناعي
على عكس قصة برج بابل في الكتاب المقدس، حيث أدت لغات متباينة إلى توقف البناء، يبدو أن الذكاء الاصطناعي اليوم يكسر الحواجز اللغوية التي كانت تُعتبر مستعصية. يوضح تومáš بوركيرت، رئيس الابتكار في TrainAI، أن أدوات الذكاء الاصطناعي غالبًا ما تشترك في أنماط إحصائية بين اللغات، ومع تطور النماذج الحديثة، لم تعد الحاجة إلى مجموعات بيانات ضخمة لكل لغة لتحقيق نتائج موثوقة ضرورية، إذ تتيح تقنيات النقل بين اللغات مشاركة المعرفة لتعويض نقص البيانات.
تحسين كفاءة المعالجات النصية وتأثيرها على الأداء
كما سجل فريق RWS تحسينات مهمة في كفاءة أدوات تقسيم النص، المعروفة بـ”الترميز”، والتي تؤثر على مدى كفاءة النماذج في معالجة النصوص بلغات مختلفة. تتضافر هذه التطورات مع غيرها من تحسينات النموذج، لتوفير مكاسب أداء ملموسة خاصة في اللغات النادرة والمجهولة.
وأشارت الدراسات إلى وجود ظاهرة تسمى “انحراف المعيار”، حيث يمكن أن تتغير قدرات النماذج بشكل غير متوقع من نسخة إلى أخرى. على سبيل المثال، تفوقت نماذج GPT الأقدم على النسخ الأحدث في بعض مهام توليد المحتوى، رغم أن النسخ الأقدم كانت أكثر تنافسية في تلك المهام.
تحديات وتوقعات مستقبلية في مجال النماذج اللغوية
كما أظهرت الاختبارات أن كفاءة تقسيم النص تختلف بشكل كبير بين إصدارات النموذج، حيث كانت إحدى النماذج أكثر فعالية من حيث التكلفة بثلاثة أضعاف من نموذج آخر في بعض اللغات. هذا يعني أن الشركات لا يمكنها الاعتماد فقط على الأداء السابق عند اختيار النموذج المناسب لتطبيقات متعددة اللغات.
حتى وقت قريب، كانت مراكز الأبحاث تركز على تحسين الأداء في الإنجليزية وعدد محدود من اللغات الرئيسية، لكن مع تطور النماذج وتحسن أدائها في تلك اللغات، بدأ التركيز يتوجه نحو تلبية احتياجات جمهور عالمي أوسع. ويُتوقع أن تتبع المزيد من المختبرات هذا الاتجاه. النجاح في استراتيجيات الذكاء الاصطناعي للمؤسسات يتطلب استمرارية التحقق من جودة البيانات الثقافية والنوعية، بدل الاعتماد على نتائج لوحات التصنيف العامة.
ومع ذلك، فإن درجة 4.5 من 5 على مقياس اصطناعي لا تضمن الطلاقة في الاستخدام الحقيقي، إذ لا تزال البيانات متعددة اللغات غير مركز عليها بشكل كامل. وفقًا لبوركيرت، فإن مراكز الأبحاث تلجأ إلى البيانات متعددة اللغات جزئيًا لأنها استنفدت المصادر ذات الجودة العالية باللغة الإنجليزية.
ختامًا: الذكاء الاصطناعي كـ”ملك بابل” الجديد
يبدو أن الذكاء الاصطناعي يكشف عن نفسه كـ”ملك بابل” الحقيقي، ليس لبناء ناطحة سحاب، بل لتمزيق الجدران التي قسمّت البشر بلغاتهم. على الرغم من أن التاج لا يبدو مناسبًا تمامًا بعد، إلا أن الاتجاه والأفكار واضحة جدًا، وتظهر أن التكنولوجيا تتجه نحو عالم أكثر ترابطًا وتفاهمًا بين الشعوب.
