1 دقيقة قراءة تقنية

تقوم الشركات بجمع بطاقات الرسوميات المتقدمة للذكاء الاصطناعي وتترك معظم تلك القدرة الحاسوبية المكلفة غير مستخدمة، بينما تتصاعد الفواتير بصمت.

تكشف تقارير حديثة عن انخفاض ملحوظ في استغلال وحدات معالجة الرسوميات (GPU) في أنظمة الإنتاج، حيث تدفع الشركات مبالغ طائلة مقابل قدرات تصل إلى عشرين ضعف ما تحتاجه فعليًا.

ضعف الاستفادة من موارد الذكاء الاصطناعي

أظهرت دراسة أجرتها شركة Cast AI، استنادًا إلى تحليل عشرات الآلاف من مجموعات Kubernetes الموزعة على خدمات أمازون (AWS)، ومايكروسوفت أزور (Azure)، وجوجل كلاود (GCP)، أن متوسط استهلاك وحدات معالجة الرسوميات لا يتجاوز 5%.

على الرغم من اعتماد العديد من الفرق على أدوات متقدمة لإدارة تطبيقاتها، إلا أن هذه الأدوات غالبًا لا تُستخدم لتحسين استغلال البنية التحتية الأساسية، مما يفاقم المشكلة.

ارتفاع مستوى الإفراط في تخصيص الموارد

تشير البيانات إلى أن الشركات تدفع مقابل حوالي 20 ضعفًا من سعة وحدات المعالجة الرسومية التي تستخدمها فعليًا في أي وقت. وقد تم قياس ذلك مباشرة من خلال مراقبة مجموعات الإنتاج وموارد الحوسبة قبل تطبيق أي تحسينات.

وقال لوران جيل، الشريك المؤسس ورئيس شركة Cast AI: “هذه هي السنة الثالثة التي ننشر فيها هذا التقرير، والأرقام تتدهور أكثر”. وأضاف: “انخفض استغلال وحدات المعالجة المركزية (CPU) من 10% إلى 8%، وانخفض استخدام الذاكرة من 23% إلى 20%”.

أما عن الإفراط في تخصيص الموارد، فارتفع تخصيص وحدات المعالجة المركزية من 40% إلى 69%، فيما بلغت نسبة الإفراط في تخصيص الذاكرة 79%.

وهذا يعني أن المؤسسات تخصص تقريبًا ضعف الموارد اللازمة لوحدات المعالجة المركزية، وأربع أضعاف الذاكرة التي تحتاجها تطبيقاتها، الأمر الذي يؤدي إلى دفع مبالغ باهظة مقابل موارد غير مستخدمة، وتزايد هذا الاتجاه بدلاً من تراجعها.

تكلفة عالية وانعكاسات على الأسعار

تُظهر المقارنات بين تكاليف وحدات المعالجة المركزية ووحدات المعالجة الرسومية أن توقف وحدات المعالجة الرسومية عن العمل يكلّف الشركات دولارات في الساعة، في حين أن توقف وحدات المعالجة المركزية يكلف فقط بضعة سنتات.

وبشكل غير معتاد، شهدت أسعار وحدات المعالجة الرسومية ارتفاعًا منذ بداية عام 2026، حيث رفعت AWS أسعار حزم H200 بنسبة 15%، مبررة ذلك بقوى العرض والطلب، وهو تغير لم يحدث منذ أكثر من عقدين.

ويقول التقرير: “عند استغلال بنسبة 5%، لا يكون الأمر منطقيًا، لكن الميل إلى الاحتكار يعود بفائدة على الشركات التي تملأ مخزونها، رغم أن ذلك يعزز ندرة الموارد ويؤدي إلى ارتفاع الأسعار بشكل أكبر”.

الفرق بين الأداء والتقنيات

لا تعاني جميع المجموعات من ضعف الاستغلال نفسه، حيث تمكنت إحدى المؤسسات من تحقيق استغلال بنسبة 49% على وحدات H200 و30% على وحدات H100، وهو أعلى بكثير من المعدل المتوسط.

الفرق يكمن في استخدام الأدوات التلقائية التي تتيح تحسين الاستخدام بشكل مستمر، مثل تقنيات التوزيع الآلي للموارد، ومشاركة وحدات المعالجة، وتقنيات إدارة الاستهلاك المؤقت (Spot Instances).

لكن، غالبًا ما تتردد الفرق في تطبيق هذه الحلول، مفضلة الإفراط في تخصيص الموارد كوسيلة أمان، رغم أن ذلك يكلفها مبالغ طائلة.

التحول إلى إدارة مستدامة للموارد

أفضل الشركات تبدأ في اعتبار إدارة الكفاءة في استغلال الموارد عملية مستمرة، وليس مهمة يدوية لمرة واحدة، من خلال اعتماد أنظمة أوتوماتيكية لضبط الحجم وتحسين الأداء باستمرار.

ومع ذلك، تظهر بيانات Cast AI أن معظم الشركات لا تزال تتردد في تبني هذه الممارسات، وتواصل دفع مبالغ كبيرة مقابل موارد غير مستغلة، مما يفاقم المشكلة ويؤدي إلى ارتفاع التكاليف بشكل مستمر.

توصية للمستقبل

لتحقيق كفاءة أكبر وتقليل التكاليف، من الضروري أن تتبنى الشركات أدوات وتقنيات إدارة الموارد بشكل أكثر ذكاءً، وتعمل على تحسين استغلال وحدات المعالجة الرسومية بشكل مستمر بدلاً من الاعتماد على الإفراط في التخصيص كحماية مؤقتة.

المصدر: feed_name]

اترك تعليقاً

هل أنت مستعد لتكون قصة نجاحنا القادمة؟

دعنا نجرب رؤيتك الرقمية ونبني حضورك الرقمي بكل تفاصيل وإبداع.

واتساب