Saat membandingkan bagaimana GPT-4.5 dan GPT-4O menangani pertanyaan yang ambigu, beberapa perbedaan utama muncul berdasarkan evaluasi desain dan kinerja mereka:
1. Arsitektur dan desain model:
-GPT-4O dioptimalkan untuk efisiensi dan multimodality, menangani teks, gambar, audio, dan input video secara lebih efektif daripada GPT-4. Ini dirancang untuk menjadi lebih cepat dan lebih efisien secara komputasi, yang dapat mempengaruhi cara memproses informasi yang ambigu dengan berpotensi memberikan respons yang lebih rinci, kadang -kadang ke titik verbositas [2] [6].
- GPT-4.5, di sisi lain, difokuskan pada peningkatan kinerja di bidang-bidang tertentu seperti hierarki instruksi dan mengurangi halusinasi, yang mungkin membantu dalam menangani pertanyaan yang ambigu dengan mematuhi lebih ketat untuk memberikan instruksi dan mengurangi informasi yang salah [1].
2. Menangani Ambiguitas:
- GPT-4O cenderung memberikan respons yang lebih rinci, yang dapat bermanfaat dalam beberapa konteks tetapi juga dapat menyebabkan verbositas atau kebingungan ketika berhadapan dengan pertanyaan yang ambigu. Ini memiliki pemahaman kontekstual yang lebih kuat, memungkinkannya untuk lebih memahami idiom dan referensi budaya, yang dapat menguntungkan dalam skenario ambigu [6].
- GPT-4.5 belum secara khusus disorot untuk kinerjanya pada pertanyaan ambigu dalam literatur yang tersedia. Namun, perbaikannya dalam hierarki instruksi menunjukkan bahwa mungkin lebih baik dalam mengikuti instruksi spesifik dalam konteks yang ambigu, berpotensi mengurangi kesalahan dengan mematuhi pesan sistem di atas input pengguna [1].
3. Evaluasi Bias dan Keadilan:
-Kedua model telah dievaluasi untuk bias dan keadilan, dengan GPT-4O terkadang mengungguli GPT-4 dalam memberikan jawaban yang tidak memihak dalam konteks yang tidak ambigu. Namun, kinerja GPT-4.5 dalam evaluasi yang sama tidak secara eksplisit dirinci untuk pertanyaan ambigu [1].
4. Pengalaman dan Umpan Balik Pengguna:
- Pengguna telah melaporkan pengalaman beragam dengan GPT-4O, mencatat itu bisa lebih cepat dan lebih rinci tetapi kadang-kadang berjuang dengan penalaran dan logika, yang mungkin mempengaruhi penanganan pertanyaan ambigu [4]. Umpan balik pengguna GPT-4.5 kurang didokumentasikan dalam hal ini.
Singkatnya, sementara kedua model memiliki kekuatan, GPT-4O terkenal karena tanggapannya yang terperinci dan pemahaman kontekstual yang lebih kuat, yang mungkin membantu dalam menangani ambiguitas. GPT-4.5 lebih berfokus pada kepatuhan instruksi dan mengurangi halusinasi, yang juga bisa bermanfaat dalam skenario yang ambigu dengan memastikan model tetap menjadi instruksi yang memberikan. Namun, evaluasi spesifik tentang bagaimana GPT-4.5 menangani pertanyaan yang ambigu tidak dirinci secara luas dalam literatur yang tersedia.
Kutipan:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://blog.promptlayer.com/understanding-gpt-4o-vs-gpt-4-a-comparative-guide/
[3] https://community.openai.com/t/openai-model-stuggle-with-ambiguous-questions-when-using-context/63410
[4] https://community.openai.com/t/gpt-4-vs-gpt-4o-which-is-the-better/746991
[5] https://www.reddit.com/r/openai/comments/1inz75h/openai_roadmap_update_for_gpt45_gpt5/
[6] https://www.techtarget.com/searchenterpriseai/feature/gpt-4o-vs-gpt-4-how-do-they-compare
[7] https://www.youtube.com/watch?v=9kuxlaibfli
[8] https://www.kommunicate.io/blog/chatgpt-4-vs-catgpt-3-5-key-differences/