Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon كيف يقارن أداء GPT-4.5 بـ GPT-4O من حيث الهلوسة


كيف يقارن أداء GPT-4.5 بـ GPT-4O من حيث الهلوسة


GPT-4.5 و GPT-4O كلاهما من طرازات اللغة المتقدمة التي طورتها Openai ، ولكل منها تحسينات مميزة على أسلافهم. عند مقارنة أدائها من حيث الهلوسة ، يوضح GPT-4.5 انخفاضًا كبيرًا في معدلات الهلوسة مقارنة بـ GPT-4O.

تخفيض الهلوسة في GPT-4.5

-معدل الهلوسة: GPT-4.5 لديه معدل الهلوسة حوالي 19 ٪ عند اختبارها على مجموعة بيانات personqa ، وهو تحسن كبير على معدل GPT-4O حوالي 52 ٪ [2] [5]. يشير هذا التخفيض إلى أن GPT-4.5 أكثر موثوقية وأقل عرضة لتوليد المعلومات التي لا ترتكز على البيانات الواقعية.
-تقنيات التحسين: يعزى تقليل الهلوسة في GPT-4.5 إلى تقنيات الإشراف الجديدة إلى جانب الأساليب التقليدية مثل الضبط الخاضع للإشراف (SFT) وتعلم التعزيز من التعليقات البشرية (RLHF) [1]. تساعد هذه الأساليب في تعزيز الدقة الواقعية للنموذج وموثوقيتها.

مقارنة الأداء

-الدقة: من حيث الدقة على مجموعة بيانات personqa ، يحقق GPT-4.5 دقة أعلى بنسبة 78 ٪ ، مقارنة مع GPT-4O 28 ٪ [2] [5]. هذا يشير إلى أنه لا يقتصر فقط على GPT-4.5 هلوسات أقل ، ولكنه يوفر أيضًا استجابات أكثر دقة.
- الموثوقية الشاملة: يجعل معدل الهلوسة المنخفض وزيادة الدقة لـ GPT-4.5 خيارًا أكثر موثوقية للتطبيقات التي تتطلب معلومات دقيقة وجديرة بالثقة. ومع ذلك ، فإن كلا النموذجين يؤدي بشكل مماثل في بعض التقييمات ، مثل تقييمات الإنصاف والتحيز [5].

باختصار ، يتفوق GPT-4.5 على GPT-4O من حيث الحد من الهلوسة ودقتها ، مما يجعلها خيارًا أكثر موثوقية للمهام التي تتطلب معلومات دقيقة وحقيقية. ومع ذلك ، فإن كلا النموذجين لهما نقاط القوة والضعف في المجالات والتقييمات المختلفة.

الاستشهادات:
[1]
[2] https://assets.ctfassets.net/kftzwdyauwt9/7eadv6oawhxlaehuyu7db/64e9f7916d3581ba4b5d0a6c5098d1/gpt-4-5_system_card_2272025.pdf
[3]
[4] https://www.techtarget.com/searchenterpriseai/feature/gpt-4o-vs-gpt-4-how-do-hey-compare
[5] https://cdn.openai.com/gpt-4-5-system-card.pdf
[6] https://community.openai.com/t/gpt-4-vs-gpt-4o-hich-is-the-better/746991
[7] https://mashable.com/article/openai-gpt-4-5-release-how-to-try
[8] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-bigest-differences-to-consider