GPT-4.5 مقابل GPT-4: الأداء في المعرفة الضمنية واستكشاف الأخطاء وإصلاحها

كيف يختلف أداء GPT-4.5 على المعرفة الضمنية واستكشاف أسئلة استكشاف الأخطاء وإصلاحها عن GPT-4

يعكس أداء GPT-4.5 على المعرفة الضمنية وأسئلة استكشاف الأخطاء وإصلاحها ، مقارنة بـ GPT-4 ، التطورات في التعامل مع الاستعلامات المعقدة والذاتية. في حين أن المقاييس المحددة للمعرفة الضمنية واستكشاف الأخطاء وإصلاحها ليست مفصلة في المعلومات المتاحة ، يمكن تسليط الضوء على العديد من التحسينات الرئيسية في GPT-4.5:

1. التسلسل الهرمي والسلامة: تم تدريب GPT-4.5 على الالتزام بالتسلسل الهرمي للتعليم ، مما يساعد على تخفيف خطر الحقن الفوري والهجمات الأخرى. هذا يعني أنه من الأفضل في اتباع تعليمات النظام على رسائل المستخدم المتضاربة ، مما يعزز قدرته على التعامل مع السيناريوهات المعقدة التي قد تتطلب استكشاف الأخطاء وإصلاحها [1]. في المقابل ، ليس لدى GPT-4 هذا التحسين المحدد المذكور في الأدب.

2. الأسئلة الغامضة: تُظهر GPT-4.5 دقة أقل قليلاً على الأسئلة الغامضة مقارنة بـ GPT-4O (نسخة من GPT-4) ، مع دقة 0.95 لـ GPT-4O مقابل 0.95 لـ GPT-4 و 0.95 لـ GPT-4.5. ومع ذلك ، فإن أداء GPT-4.5 على الأسئلة التي لا لبس فيها يشبه GPT-4O ، مما يشير إلى أن كلا النموذجين يتعاملان مع استعلامات واضحة بشكل فعال [1].

3. لا يتم توفير المعرفة الضمنية واستكشاف الأخطاء وإصلاحها: في حين لا يتم توفير مقاييس محددة للمعرفة الضمنية واستكشاف الأخطاء وإصلاحها ، فإن قدرة GPT-4.5 المحسنة على التعامل مع الرسائل المتضاربة والتسلسل الهرمي للتعليمات المعززة تشير إلى أنه قد يكون أداءً أفضل في السيناريوهات التي تتطلب فهمًا غير محدد وإدماجها. GPT-4 ، من ناحية أخرى ، تشتهر بفهم اللغة المعزز وقدرته على توفير إجابات أكثر دقة للاستعلامات المعقدة [2].

4. القدرات متعددة الوسائط: تقدم GPT-4 ، وهي قاعدة GPT-4.5 ، تحسينات كبيرة على GPT-3.5 في القدرات متعددة الوسائط والتعامل مع المعقد. يمكن لـ GPT-4 معالجة مجموعة واسعة من مدخلات البيانات والاستجابة لها ، مما يجعلها أكثر تنوعًا للمهام التي قد تتضمن استكشاف الأخطاء وإصلاحها أو المعرفة الضمنية [2] [6].

باختصار ، في حين أن GPT-4.5 يعتمد على نقاط قوة GPT-4 ، وخاصة في التعامل مع التعليمات المعقدة وبروتوكولات السلامة ، فإن أدائها المحدد على المعرفة الضمنية وأسئلة استكشاف الأخطاء وإصلاحها غير مفصلة على نطاق واسع. ومع ذلك ، فإن التسلسل الهرمي للتعليمات المعززة وتحسين التعامل مع الرسائل المتضاربة يشير إلى أنه يمكن أن يكون أكثر فعالية في سيناريوهات استكشاف الأخطاء وإصلاحها.

الاستشهادات:
[1] https://assets.ctfassets.net/kftzwdyauwt9/7eadv6oawhxlaehuyu7db/64e9f7916d3581ba4b5d0a6c5098d1/gpt-4-5_system_card_2272025.pdf
[2]
[3] https://www.opastpublishers.com/open-access-articles/evaluating-errors-and-emproving-porformance-of-chatgpt.pdf
[4] https://pmc.ncbi.nlm.nih.gov/articles/PMC11197181/
[5] https://community.openai.com/t/gpt-performance-is-not-follow-up-to-instructions-and-tasks/613298
[6] https://www.aubergine.co/Insights/GPT-3-5-VS-GPT-4-AN-IN-IN-INDEPTH-ANSY-OF-OPENAIS-language-models
[7] https://www.marketingaiinstitute.com/blog/the-ai-how-episode-137
[8] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-bigest-differences-to-consider