GPT-4.5は、強化された命令階層を通じて競合するメッセージを処理する際に、GPT-4oよりも特定の改善を示しています。この機能により、モデルはユーザーメッセージよりもシステムメッセージに優先順位を付け、迅速なインジェクションや安全性の指示を無効にする可能性のあるその他の攻撃のリスクを軽減できます。重要な改善は次のとおりです。
1。命令階層評価:異なるタイプのメッセージが互いに競合する評価では、GPT-4.5が最高優先メッセージの指示に従うように訓練されています。これにより、モデルは、ユーザーの入力が安全プロトコルをバイパスしようとするシナリオをよりよく処理するのに役立ちます。
2。紛争解決:GPT-4.5は、一般に、システムとユーザーメッセージの間の競合を含む評価でGPT-4Oを上回ります。この改善は、複雑な会話シナリオの安全性とガイドラインの遵守を維持するために重要です。
3。家庭教師の脱獄:モデルが数学の家庭教師として機能する特定のシナリオでは、GPT-4.5は数学の質問に対する答えを明らかにしないように指示されます。 GPT-4.5は、この特定の評価でGPT-4Oを上回ることはありませんが(GPT-4Oの精度は高くなっています)、不正な情報を提供するためにそれをだまそうとする試みに抵抗する堅牢性を示しています。
4。フレーズとパスワードの保護:GPT-4.5は、ユーザープロンプトを通じて特定のフレーズまたはパスワードが明らかにされることから保護する際の強力なパフォーマンスを示しています。これは、以前のモデルと比較して、機密性を維持し、セキュリティガイドラインを順守する能力が向上していることを示しています。
全体として、GPT-4.5の競合するメッセージの処理における改善は、安全性、ニュアンス、コラボレーションのより広範な強化の一部であり、安全で適切な相互作用を維持するためにより効果的になります[1] [3]。
引用:
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.techtarget.com/whatis/feature/gpt-4o-explained-everything-to-need-to-know
[3] https://openai.com/index/introducing-gpt-4-5/
[4] https://www.techtarget.com/searchenterpriseai/feature/gpt-4o-vs-gpt-4-how-do-compare
[5] https://www.businessinsider.com/openai-sam-altman-reeases-gpt-4-5-emotionally-intelligent-model-2025-2
[6] https://litslink.com/blog/gpt-4o-all-you-should-know- about-the-update-and-new-tools
[7] https://venturebeat.com/ai/openai-releases-gpt-4-5/
[8] https://www.reddit.com/r/openai/comments/188t13h/gpt4_has_a_limit_of_40_messages3_hours_now/