الخميس، ٢٣ أبريل ٢٠٢٦
أخبار على مدار الساعة
Hatrek logoHatrekصحيفة هاتريك
أخبار عامة

الصرف العربي يعيد تعريف كفاءة النماذج اللغوية الذكية

·3 دقيقة قراءة
الصرف العربي يعيد تعريف كفاءة النماذج اللغوية الذكية

مشروع "الترميز الدلالي السياقي" يطرح حلاً جديداً

يبحث العالم اليوم عن طرق لتحسين كفاءة النماذج اللغوية الذكية، خاصة مع تزايد الاستثمارات في مراكز البيانات والقدرات الحوسبية الهائلة. في هذا السياق، يبرز مشروع بحثي طموح يحمل اسم "الترميز الدلالي السياقي" (سي إس تي/CST)، وهو مشروع أعدّه الباحث السوري في الذكاء الاصطناعيعماد الدين جمعة.

تحسين كفاءة النماذج اللغوية

يطلق مشروع "سي إس تي" مقاربة ثورية تنطلق من بنية اللغة العربية لتصحيح مسار كفاءة النماذج اللغوية عالميا. فالنماذج اللغوية الذكية لا تقرأ النصوص كما نفعل؛ بل تجزئها أولا إلى وحدات صغيرة تسمى "رموزا". وفي الأنظمة الشائعة اليوم، يتم هذا غالبا بأساليب إحصائية صرفة، تبني المفردات على أساس الأنماط الحرفية الأكثر تكرارا.

خصوصية اللغة العربية

وبالنسبة للغة العربية، تصبح المسألة أكثر حساسية؛ فالكلمة العربية تحمل في بنيتها معلومات مكثفة عنالجذر، والوزن، والزمن، والضمائر. وعندما تتعامل أدوات الترميز الإحصائية مع هذه البنية بوصفها مجرد تتابع حروف، فإنها تنتج تسلسلات أطول وتمثيلات أقل وضوحا من الناحية اللغوية، مما يضطر النموذج لبذل جهد أكبر "لفهم" ما يقرأه.

مشروع "سي إس تي" يقدم حلاً

انطلقت فكرة مشروع "سي إس تي" من ملاحظة في الصرف العربي، حيث يسمح نظامالجذر والوزن بتمثيل العلاقة بين البنية والمعنى بشكل مباشر. فالجذر "ك-ت-ب"، مثلا، يشير إلى حقل الكتابة، ومنه تتولد كلمات "كاتب، وكتاب، ومكتبة، ومكتوب". وينطلق المشروع من هذه الملاحظة ليعممها إطار عمل عالميا يهدف إلى تحويل الكلمات في لغات مختلفة إلى وحدات دلالية أكثر انتظاما.

نتائج مشجعة

وأثبتت التجارب التي أجريت على نماذج من طراز "جي بي تي-2" (GPT-2) أن هذه المقاربة ليست مجرد نظرية لغوية، بل تفوق تقني ملموس. ففي اختبارات مضبوطة على اللغة الإنجليزية، خفّض "سي إس تي" مقدار المعلومات اللازمة لتمثيل النص، أو مقياس "البتات لكل حرف" (BPC) بنسبة وصلت إلى35.5%، كما قلّص طول الجملة بنسبة30%، مما أدى إلى تسريع زمن التدريب بنسبة36%.

النتائج في اللغة العربية

أما في الاختبارات العربية، فكانت النتائج أكثر إذهالا؛ حيث سجل "سي إس تي" تحسنا في كفاءة التمثيل بنسبة وصلت إلى46% مقارنة بالمرمزات التقليدية. وهذه النتائج تقترح قراءة عملية واضحة: كلما أصبحت وحدة الإدخال أكثر قربا من البنية اللغوية، أمكن للنموذج تمثيل الجملة بعدد خطوات أقل وكلفة أقل.

الأهمية العملية

وتتجاوز الأهمية هنا الأروقة الأكاديمية لتصبح مسألة مالية وتشغيلية. ففي بيئة تستثمر بكثافة في الذكاء الاصطناعي، يعني تقليل طول التسلسل ورفع جودة التمثيل خفض تكلفة التدريب وزيادة سرعة الاستدلال. وهذا الأمر حيوي لقطاعات مثلالخدمات الحكومية، والتعليم، والرعاية الصحية، حيث لا تكون الأولوية دائما لأكبر نموذج ممكن، بل للنموذج الأكثر دقة وامتثالا لغويا وأقل كلفة.

التوسع المستقبلي

كما ينسجم بناء أدوات تأسيسية تنطلق من العربية والإنجليزية مع التوجه الإقليمي نحو تطوير قدرات محلية أصيلة في الذكاء الاصطناعي، بدلا من الاكتفاء باستهلاك النماذج الجاهزة التي قد لا تراعي خصوصية لغاتنا.

مستقبل النماذج اللغوية

ويعمل المشروع حاليا على تحويل "سي إس تي" من فكرة بحثية إلى أداة عملية، مع التركيز على تشغيل النماذج على الأجهزة المحلية أو داخل المتصفح. والفكرة هي أنه مع تقنيات الضغط والتحسين، قد يساعد مشروع "سي إس تي" على جعل النماذج اللغوية أخف وأكثر قابلية للاستخدام اليومي دون الحاجة لبنية سحابية ثقيلة.

الخلاصة

فهذا المشروع يطرح مسارا مختلفا، فبدلا من النظر إلى الأداء بوصفه نتيجة للتوسع في الحوسبة وحده، يركز هذا المسار على جودة التمثيل منذ الخطوة الأولى. وإذا استمرت النتائج في هذا الاتجاه، فقد يصبح هذا التصميم عاملا حاسما في بناء نماذج أكثر كفاءة، وقابلية للتطبيق، واستدامة في منطقتنا والعالم.

مشاركة:

مقالات ذات صلة

ركود أمريكي محتمل: ديفيد سولومون يحذر من التغريدة المفاجئة وزيادة النفط
أخبار عامة

ركود أمريكي محتمل: ديفيد سولومون يحذر من التغريدة المفاجئة وزيادة النفط

٢٢ أبريل ٢٠٢٦

يرفع رئيس غولدمان ساكس مخاطر ركود الاقتصاد الأمريكي إلى 30%، ويحذر من أن التغريدة المفاجئة قد تحدد اتجاه الأسواق، مع ارتفاع أسعار النفط بنحو 30% منذ بداية الحرب، وصولا إلى 120 دولار للبرميل في مارس الماضي.

أسعار القهوة العالمي ترتفع بسبب الحرب الإيرانية وجفاف البرازيل
أخبار عامة

أسعار القهوة العالمي ترتفع بسبب الحرب الإيرانية وجفاف البرازيل

٢٢ أبريل ٢٠٢٦

ارتفعت أسعار القهوة في الأسواق العالمية بسبب تأثير الحرب الإيرانية على الطاقة والشحن، وتهديدات الجفاف للمحاصيل البرازيلية، مما يدعم أسعار الغذاء والمواد الأولية في جميع أنحاء العالم، ما يوقع المستهلك في أزمة جديدة.

فاتورة 40 يوماً من الحرب: خسائر مادية وبشرية هائلة في طهران
أخبار عامة

فاتورة 40 يوماً من الحرب: خسائر مادية وبشرية هائلة في طهران

٢٢ أبريل ٢٠٢٦

تكشف التقارير الميدانية عن خسائر مالية تصل إلى170 مليار دولار، ومقتل3371 مدنياً وإصابة34 ألف جريح، إلى جانب دمار واسع في السكن والمدارس والمستشفيات، وتفاصيل وعد الحكومة الإيراني بإعادة الإعمار رغم التحديات.

مصر تدعو لتنفيذ خطة ترمب بشأن غزة بسرعة لتحقيق سلام
أخبار عامة

مصر تدعو لتنفيذ خطة ترمب بشأن غزة بسرعة لتحقيق سلام

٢٢ أبريل ٢٠٢٦

تدعو مصر إلى استكمال تنفيذ خطة الرئيس الأمريكي دونالد ترمب بشأن قطاع غزة، بما في ذلك ضمان نفاذ المساعدات الإنسانية، والشروع في برامج التعافي المبكر، وإعادة الإعمار، وسط تطورات خطيرة في الضفة الغربية، واقتحامات مستوطنين للأقصى، وتواصل القتال في غزة، وتعزز الحكومة المصرية على استقرار هذه المنطقة وتحقيق سلام دائم.

الرئيس اللبناني يؤكد استمرار المفاوضات مع إسرائيل
أخبار عامة

الرئيس اللبناني يؤكد استمرار المفاوضات مع إسرائيل

٢٢ أبريل ٢٠٢٦

أكد الرئيس اللبناني جوزيف عون على استمرار المفاوضات لتمديد وقف إطلاق النار مع إسرائيل، مع السعي لوقف الاعتداءات والانسحاب الإسرائيلي وعودة النازحين وتعزيز الأمن، ماذا يعني ذلك للعلاقات بين البلدين؟

مهلة إضافية من ترمب لإيران: انقسام داخلي يعرقل المفاوضات
أخبار عامة

مهلة إضافية من ترمب لإيران: انقسام داخلي يعرقل المفاوضات

٢٢ أبريل ٢٠٢٦

كشف مسؤولون أمريكيون عن أزمة انقسام حادة داخل النظام الإيراني بين المفاوضين والجيش، فيما منح الرئيس دونالد ترمب مهلة إضافية لوقف إطلاق النار، ولكن هل ستفيد هذه المهلة في التوصل إلى اتفاق أم سترفع مستوى التوتر؟