Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon كيف تقارن دقة GPT-4.5 على أسئلة استكشاف الأخطاء وإصلاحها بدقة GPT-4O و O1


كيف تقارن دقة GPT-4.5 على أسئلة استكشاف الأخطاء وإصلاحها بدقة GPT-4O و O1


إن دقة GPT-4.5 على أسئلة استكشاف الأخطاء وإصلاحها ، وخاصة في المجالات المعقدة مثل استكشاف الأخطاء وإصلاحها متعددة الوسائط ، ليست مفصلة بشكل صريح في المعلومات المتاحة. ومع ذلك ، أظهر GPT-4.5 تحسينات في مناطق معينة مقارنة بأسلافها. على سبيل المثال ، يعمل بشكل أفضل في التعرف على الأنماط واتصالات الرسم ، والتي يمكن أن تعزز قدراتها على استكشاف الأخطاء وإصلاحها [5].

من حيث التقييمات المحددة ، يؤدي GPT-4.5 عمومًا على قدم المساواة مع GPT-4O و O1 في رفض المحتوى غير الآمن وفي بعض التقييمات المتعلقة بالسلامة [1] [4]. ومع ذلك ، عندما يتعلق الأمر بالدقة في الإجابة على الأسئلة ، أظهر GPT-4.5 تحسينات كبيرة في مجموعات البيانات معينة. على سبيل المثال ، في مجموعة بيانات PersonQa ، التي تقيم الهلوسة والدقة ، يحقق GPT-4.5 دقة 0.78 ومعدل الهلوسة 0.19 ، يتفوق على GPT-4O و O1 [1] [4].

في تقييمات الإنصاف والتحيز ، يؤدي GPT-4.5 بشكل مشابه لـ GPT-4O ولكنه يتفوق على O1 في تقديم إجابات غير متحيزة على الأسئلة التي لا لبس فيها [1] [4]. على الرغم من أن GPT-4.5 قد أظهرت تحسينات في التعامل مع الرسائل المتضاربة والالتزام بتعليمات السلامة ، إلا أن دقتها الإجمالية في أسئلة استكشاف الأخطاء وإصلاحها على وجه التحديد لا تقارن بشكل مباشر مع GPT-4O و O1 في البيانات المتاحة [1] [4].

بشكل عام ، قد تعزز قدرة GPT-4.5 على التعرف على الأنماط واتصالات الاتصال أدائها في مهام استكشاف الأخطاء وإصلاحها ، ولكن المقارنات المحددة في هذا المجال محدودة. لاحظ مراقبو الصناعة تحسينات في مهام معينة ، مثل استخراج البيانات ، حيث يتفوق GPT-4.5 على GPT-4O عن طريق استخراج الحقول بشكل أكثر دقة [7]. ومع ذلك ، لا يتم توفير مقارنات مفصلة خصيصًا لاستكشاف الأخطاء وإصلاحها في المعلومات المتاحة.

الاستشهادات:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2]
[3]
[4] https://assets.ctfassets.net/kftzwdyauwt9/7eadv6oawhxlaehuyuyu7db/64e9f7916d3581ba4b5d0a6c5098d1/gpt-4-5_system_card_2272025.pdf
[5] https://www.theverge.com/news/620021/openai-gpt-4-orion-ai-model-release
[6]
[7]
[8] https://community.openai.com/t/gpt-4-vs-gpt-4o-hich-is-the-better/746991