علماء البيانات: خفّضوا تجاوزات تكلفة نماذج اللغة الكبيرة

غالباً ما تتجاوز الفرق ميزانيات نماذج اللغة الكبيرة (LLM) بنسبة 340% في المتوسط، ولكن نهجاً جديداً يسمح لعلماء البيانات بتحديد وتقليل هذه التجاوزات من خلال تخصيص تكاليف دقيق على مستوى الاستعلام. هذه القدرة تحول الطريقة التي يدير بها المحترفون حلول AI في بيئة الإنتاج، محولة النفقات المخفية إلى رؤى قابلة للتنفيذ ومحولة التركيز من معدلات لكل رمز (token) إلى كفاءة تشغيلية شاملة.

ما تغير لعلماء البيانات: لقد تحول المشهد الخاص بعلماء البيانات الذين يبنون حلول AI في بيئة الإنتاج بشكل أساسي إلى ما هو أبعد من مجرد تدريب النماذج. القرارات الحاسمة تدور الآن حول مقايضات معقدة تؤثر مباشرة على الميزانية وسرعة النشر وإمكانية الصيانة على المدى الطويل. في عصر نماذج اللغة الكبيرة (LLM)، لم يعد السؤال حول البناء مقابل الشراء يتعلق بالتدريب من الصفر، بل يتعلق بالاختيار بين استدعاء API، أو الضبط الدقيق لنموذج مفتوح المصدر، أو بناء واستضافة مجموعة مخصصة. أشارت دراسة Omdia لعام 2025 إلى أن 95% من أصحاب المصلحة يعتقدون أن البناء يوفر تخصيصاً أكبر، بينما وافق 91% على أن المنصات الجاهزة يتم شحنها بشكل أسرع. كلا الأمرين صحيح، مما يخلق معضلة تؤثر بشكل مباشر على جداول مشاريع علماء البيانات وتخصيص الموارد. أقل من 100 ألف طلب يومي، غالباً ما تكون واجهات برمجة التطبيقات (APIs) مثل GPT-4o Mini مثالية لانخفاض عبئها، ولكن مع أكثر من مليون طلب يومي، يمكن لتكاليف لكل رمز (token) أن تقضي على الأرباح بسرعة. والأهم من ذلك، أن الأجهزة والكهرباء تمثل 20-30% فقط من تكاليف الاستضافة الذاتية؛ أما الـ 70-80% المتبقية فهي موظفون، وهو عامل غالباً ما يتم التقليل من شأنه في التقديرات الأولية. يحتاج علماء البيانات إلى حساب تكاليف MLOps المخفية هذه وعبء الارتباط بإطار عمل (framework lock-in)، مما قد يتطلب عمليات ترحيل مكلفة في وقت لاحق.

إلى جانب تكاليف نماذج اللغة الكبيرة (LLM) فقط، يتعامل علماء البيانات مع مبدأ CACE (تغيير أي شيء يغير كل شيء) في أنظمة التعلم الآلي (ML). يمكن لتعديل صغير أن يؤدي إلى تأثيرات متتالية غير متوقعة، خاصة مع النماذج المعقدة. تكشف الأبحاث أن الاعتماد على البيانات هو شكل أكثر تكلفة من الديون التقنية مقارنة بالاعتماد على الكود، لأن البيانات يصعب تتبعها وإصدارها وشرحها للموظفين المستقبليين. جزء كبير من نظام تعلم آلي (ML) في العالم الحقيقي ليس هو كود النموذج نفسه، بل البنية التحتية المحيطة به: مخازن الميزات، منطق خطوط الأنابيب، المراقبة، ومحفزات إعادة التدريب. غالباً ما يختار علماء البيانات نموذجاً أكثر تعقيداً لتحقيق مكسب هامشي في الدقة بنسبة 2%، ليقضوا 18 شهراً في التصحيح، وتكاليف إعادة التدريب، والصيانة – وهو خيار يؤثر بشكل غير متناسب على إنتاجيتهم وجداول مشاريعهم. يتطلب دمج AI التحليلي التنبؤي بفعالية فهماً دقيقاً لهذه التكاليف التشغيلية طويلة الأجل، وليس فقط مقاييس الأداء الأولية.

قبل تنفيذ تخصيص دقيق للتكاليف لأدوات AI الخاصة بهم لعلماء البيانات:

كان عالم البيانات يقدّر يدوياً استخدام LLM API بناءً على فواتير المشاريع الإجمالية، وغالباً ما كان يجد تجاوزات في الميزانية بنسبة 340% دون معرفة الميزات أو الاستعلامات المحددة المسؤولة. أدى هذا إلى إجراءات خفض تكاليف تفاعلية وغير مستهدفة وقضاء وقت كبير في محاولة عكس هندسة أنماط الاستخدام، مما استغرق أحياناً أسابيع لتحديد السبب الجذري لارتفاع التكاليف.

بعد:

مع التخصيص الدقيق للتكاليف على مستوى الاستعلام، يمكن لعالم البيانات رؤية الميزات أو مجموعات المستخدمين أو حتى الاستعلامات المحددة التي تدفع استهلاك LLM بدقة. يسمح هذا بالتحسين الاستباقي، وتحديد الاستعلامات غير الفعالة أو الميزات في غضون ساعات بدلاً من أسابيع، مما يتيح إجراء تعديلات مستهدفة يمكن أن تمنع تجاوز الميزانية وتحرر وقتاً كبيراً للنموذج الأكثر تأثيراً.

هذه المقالة لأغراض المعلومات العامة فقط ولا تشكّل نصيحة مهنية. كانت الحقائق وتفاصيل المنتجات والأرقام دقيقة حسب علمنا وقت النشر وقد تكون تغيّرت منذ ذلك الحين. زيكاي ناشر مستقل وغير تابع للشركات المذكورة. وجدت خطأً؟ راجع سياسة التصحيحات والإزالة.

#AI news#AI tools#artificial intelligence#Data Scientist#workflow automation

موجز الذكاء الاصطناعي الأسبوعي لمهنتك

بريد واحد أسبوعيًا: تغييرات الذكاء الاصطناعي التي تمسّ مهنتك فعلًا — أدوات وعروض وما يجب فعله.

مجاني · رسالة واحدة أسبوعيًا · مصنّفة حسب المهنة · إلغاء الاشتراك متى شئت

← الخبر السابقعلماء البيانات يقللون زمن استجابة أنظمة التوصية بنسبة 75% عبر التكيف شبه الفوري الخبر التالي →يمكن لعلماء البيانات الآن نشر نماذج اللغات الكبيرة (LLMs) أسرع بـ 8 مرات مع TurboQuant من Google

تصفّح حسب المهنة

مجموعات

الشركة

علماء البيانات: خفّضوا تجاوزات تكلفة نماذج اللغة الكبيرة بنسبة 340% مع تخصيص دقيق للتكاليف

موجز الذكاء الاصطناعي الأسبوعي لمهنتك