GPT-4.5：競合する指示の処理におけるパフォーマンスの向上

GPT-4.5のパフォーマンスは、競合する指示を処理する際の以前のバージョンと比較してどうですか

GPT-4.5は、特に拡張された命令階層を通じて、以前のバージョンと比較して、競合する命令の処理のパフォーマンスの向上を示しています。この機能により、モデルはユーザー入力よりもシステムメッセージに優先順位を付けることができ、迅速な注入やその他の攻撃に関連するリスクを軽減し、安全命令を上書きする可能性があります。

矛盾するメッセージタイプを含む評価では、GPT-4.5は一般にGPT-4Oを上回ります。このモデルは、システムとユーザーメッセージが競合するシナリオで役立つ最高の優先順位メッセージの指示に従うように訓練されています。たとえば、モデルが数学の質問への答えを提供しないように指示されているシナリオでは、GPT-4.5はGPT-4oと比較してこれらのシステム命令のより良い遵守を示していますが、すべての評価でGPT-4O1を上回りません[1]。

さらに、GPT-4.5は、特定のフレーズまたはパスワードがユーザープロンプトを介して明らかにされることから保護する必要があるシナリオで評価されています。これらの評価では、GPT-4.5はうまく機能し、対立するユーザー入力に直面してもセキュリティを維持し、システムの命令に従う能力を示します[1]。

ただし、GPT-4.5は、競合する指示の処理において以前のモデルを改善しますが、特定の複雑なシナリオでは依然として課題に直面しています。敵対的なプロンプトをシミュレートする赤チームの評価におけるモデルのパフォーマンスは、これらの困難なテストでは一般にGPT-4Oよりも優れたパフォーマンスを発揮することがあることを示しています[1]。

全体として、GPT-4.5の競合する指示の取り扱いにおける強化により、安全ガイドラインとシステムの指示を厳密に順守する必要があるアプリケーションのより信頼性の高い選択となります。

引用：
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://gettalkative.com/info/gpt-models-compared
[3] https://www.vellum.ai/blog/gpt-4-5-is-heres-how-good-this-model-is
[4] https://www.techtarget.com/searchenterpriseai/tip/gpt-35-vs-gpt-4-giggest-differences to-sonsider
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://www.reddit.com/r//openai/comments/18monbs/gpt_4_has_been_toned_down_significly_and/
[7] https://www.theverge.com/news/620021/openai-gpt-4-5-5-5-Orion-ai-model-release
[8] https://www.axios.com/2025/02/27/chatgpt-45-model-openai-rainsing