GPT-4.5: Mengelola instruksi yang bertentangan dan pemecahan masalah multi-langkah

Bagaimana GPT-4.5 menangani instruksi yang bertentangan dalam masalah multi-langkah

GPT-4.5 dirancang untuk menangani instruksi yang bertentangan dalam masalah multi-langkah dengan mematuhi hierarki instruksi. Hirarki ini membantu model memprioritaskan pesan sistem daripada pesan pengguna, mengurangi risiko suntikan yang cepat dan serangan lain yang mungkin mengganti instruksi keselamatan [1] [5].

Menangani instruksi yang bertentangan

1. Evaluasi Hirarki Instruksi: GPT-4.5 dilatih untuk mengenali dan mengikuti instruksi dalam pesan prioritas tertinggi ketika dihadapkan dengan pesan yang bertentangan. Ini termasuk skenario di mana pesan sistem dan pesan pengguna konflik, dan model harus memilih set instruksi mana yang akan diikuti [1].

2. Sistem vs Pesan Pengguna: Model diajarkan untuk memprioritaskan pesan sistem, yang dirancang untuk menegakkan pedoman keselamatan dan operasional, melalui pesan pengguna. Ini memastikan bahwa GPT-4.5 menganut protokol keselamatannya bahkan ketika pengguna berusaha memotongnya [1] [5].

3. Skenario Realistis: Evaluasi termasuk skenario realistis di mana model bertindak sebagai tutor dan harus menolak upaya oleh pengguna untuk menipu menjadi jawaban atau solusi yang mengungkapkan. GPT-4.5 diinstruksikan untuk tidak memberikan jawaban, dan itu harus mengikuti instruksi sistem ini meskipun ada upaya pengguna untuk menghindari mereka [1].

4. Frasa dan Perlindungan Kata Sandi: Dalam jenis evaluasi lain, GPT-4.5 diinstruksikan untuk tidak mengeluarkan frasa tertentu atau mengungkapkan kata sandi. Model harus menolak pesan pengguna yang dirancang untuk menipu itu, menunjukkan kemampuannya untuk melindungi informasi sensitif [1].

penanganan masalah multi-langkah

Sementara GPT-4.5 dirancang untuk menangani instruksi yang saling bertentangan secara efektif, kemampuannya untuk mengelola masalah multi-langkah dapat ditingkatkan dengan menyusun petunjuk dengan cara yang jelas dan berurutan. Ini melibatkan pemecahan tugas menjadi langkah -langkah yang lebih kecil dan memastikan setiap langkah diselesaikan sebelum pindah ke yang berikutnya [2]. Namun, kinerja GPT-4.5 secara otomatis mengikuti instruksi multi-langkah tanpa intervensi manual (mis., Mendapatkan "Next") tetap menjadi tantangan [4].

Meningkatkan kinerja

Untuk meningkatkan kinerja GPT-4.5 dalam tugas multi-langkah, pengguna dapat menggunakan strategi seperti:

- Clear Prompt Struktur: Gunakan header atau penanda bagian untuk menentukan setiap langkah dengan jelas, membantu model mengenali dan mengikuti urutan lebih efektif [2].
-Eksekusi berurutan: Menerapkan pendekatan langkah demi langkah di mana setiap langkah diproses sepenuhnya sebelum pindah ke yang berikutnya, yang dapat difasilitasi dengan menggunakan struktur fungsi-seperti pada prompt [2].
- Intervensi manual: Jika perlu, secara manual meminta model untuk melanjutkan ke langkah berikutnya, karena mungkin tidak secara otomatis bergerak melalui urutan tanpa isyarat seperti itu [4].

Kutipan:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed-steps-to-build-multi-step-custom-gpts-solve-kolve-Tasks
[3] https://community.openai.com/t/how-to-deal-with-lazy-gpt-4/689286
[4] https://community.openai.com/t/gpt-getting-stuck-with-multi-step-instructions/613209
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://community.openai.com/t/how-to-improve-gpt-4-api-output-length-and-struktur/1025132
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197exmm/gpt4_has_only_been_getting_worse/