يواجه كل من GPT-4.5 و GPT-4 تحديات عند التعامل مع اللغات ذات الموارد المنخفضة ، ولكن هناك بعض الاختلافات في أساليبها وأدائها.
GPT-4 أداء على اللغات منخفضة الموارد
أظهر GPT-4 ، مثل نماذج اللغة الكبيرة الأخرى ، قدرات رائعة في اللغات عالية الموارد ولكنها تكافح مع لغات منخفضة الموارد. أشارت الدراسات إلى أن أداء GPT-4 في هذه اللغات ليس قويًا كما في اللغة الإنجليزية أو اللغات الأخرى الممثلة جيدًا [1] [3]. ويرجع ذلك جزئيًا إلى بيانات التدريب المحدودة المتاحة لهذه اللغات ، مما يؤدي إلى الرمز المميز وفهم الفروق اللغوية الأقل فعالية [1]. بالإضافة إلى ذلك ، تم العثور على مرشحات السلامة من GPT-4 لتكون أقل فعالية عند التعامل مع المدخلات المترجمة إلى لغات منخفضة الموارد ، مما يجعل من السهل تجاوز الضمانات [5].
GPT-4.5 تحسينات للغات منخفضة الموارد
يهدف GPT-4.5 إلى تحسين قدرات GPT-4 ، بما في ذلك تعاملها مع اللغات ذات الموارد المنخفضة. في حين أن تحسينات محددة للغات منخفضة الموارد ليست مفصلة على نطاق واسع ، يُشار إلى أن GPT-4.5 يتفوق على GPT-4 في التقييمات متعددة اللغات. على سبيل المثال ، في التقييمات باستخدام مجموعة اختبار MMLU المترجمة إلى 14 لغة ، بما في ذلك اللغات منخفضة الموارد مثل Yoruba ، أظهرت GPT-4.5 أداء أفضل مقارنة بـ GPT-4 [9]. هذا يشير إلى أن GPT-4.5 قد يكون لديه دعم متعدد اللغات يعزز وربما التعامل مع الفروق الدقيقة اللغوية بشكل أفضل في اللغات منخفضة الموارد.
ومع ذلك ، فإن التحسينات في GPT-4.5 تدور حول الأداء الكلي متعدد اللغات بدلاً من تحسينات محددة للغات منخفضة الموارد. يشير استخدام المترجمين البشريين لتقييم القدرات متعددة اللغات إلى التركيز على ضمان ترجمات دقيقة ، والتي يمكن أن تستفيد بشكل غير مباشر من اللغات منخفضة الموارد من خلال توفير بيانات أكثر موثوقية للتحسينات المستقبلية [9].
التحديات والاتجاهات المستقبلية
على الرغم من هذه التحسينات ، لا يزال كل من GPT-4 و GPT-4.5 يواجهان تحديات كبيرة مع لغات منخفضة الموارد. غالبًا ما ينصح بتقنيات التحويل الدقيقة والتقنيات المتخصصة لتعزيز الأداء في هذه اللغات [7]. يسلط التباين في السلامة والأداء بين اللغات ذات الموارد العالية والموارد المنخفضة الضوء على الحاجة إلى بروتوكولات تدريب أكثر شمولاً وبروتوكولات السلامة التي تمثل التنوع اللغوي [5].
باختصار ، في حين توفر GPT-4.5 بعض التحسينات على GPT-4 في السياقات متعددة اللغات ، فإن تحسينات محددة للغات منخفضة الموارد ليست مفصلة على نطاق واسع. مزيد من البحث والتطوير ضروريان لمواجهة التحديات المستمرة في هذه اللغات.
الاستشهادات:
[1] https://aclanthology.org/2024.findings-emnlp.920.pdf
[2]
[3] https://www.asianlp.sg/conferences/ialp2024/proceedings/papers/ialp2024_p027.pdf
[4] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-bigest-differences-to-consider
[5] https://arxiv.org/pdf/2310.02446.pdf
[6]
[7] https://aclanthology.org/2025.coling-main.559.pdf
[8]
[9] https://cdn.openai.com/gpt-4-5-system-card.pdf