GPT-4.5：矛盾する指示とマルチステップの問題解決の管理

GPT-4.5は、命令階層を順守することにより、マルチステップの問題の矛盾する指示を処理するように設計されています。この階層は、モデルがユーザーメッセージよりもシステムメッセージに優先順位を付けるのに役立ち、迅速なインジェクションや安全性の指示を無効にする可能性のあるその他の攻撃のリスクを軽減するのに役立ちます[1] [5]。

###競合する指示の処理

1。命令階層評価：GPT-4.5は、競合するメッセージに直面したときに、最高の優先順位メッセージの指示を認識し、従うように訓練されています。これには、システムメッセージとユーザーメッセージが競合するシナリオが含まれ、モデルはどの命令セットに従うか[1]を選択する必要があります。

2。システムとユーザーメッセージ：モデルは、ユーザーメッセージを介して安全性と運用ガイドラインを実施するように設計されたシステムメッセージの優先順位付けを教えられます。これにより、ユーザーがそれらをバイパスしようとした場合でも、GPT-4.5が安全プロトコルを遵守することが保証されます[1] [5]。

3.現実的なシナリオ：評価には、モデルが家庭教師として機能し、ユーザーがそれをだまして回答やソリューションを明らかにするために試みに抵抗する必要がある現実的なシナリオが含まれます。 GPT-4.5は、回答を提供しないように指示されており、ユーザーを回避する試みにもかかわらず、これらのシステム命令に従う必要があります[1]。

4。フレーズとパスワードの保護：別のタイプの評価では、GPT-4.5は特定のフレーズを出力したり、パスワードを公開したりしないように指示されます。モデルは、それをだましてそうするように設計されたユーザーメッセージに抵抗し、機密情報を保護する能力を実証する必要があります[1]。

###マルチステップの問題処理

GPT-4.5は競合する命令を効果的に処理するように設計されていますが、マルチステップの問題を管理する能力は、プロンプトを明確で順番に構成することで改善できます。これには、タスクをより小さなステップに分割し、次のステップに移動する前に各ステップが完了するようにします[2]。ただし、手動介入なしでマルチステップの指示を自動的に追跡するGPT-4.5のパフォーマンス(たとえば、「次の」を促す)は依然として課題です[4]。

###パフォーマンスの向上

マルチステップタスクでのGPT-4.5のパフォーマンスを強化するために、ユーザーは以下などの戦略を採用できます。

- 迅速な構造をクリアする：ヘッダーまたはセクションマーカーを使用して各ステップを明確に定義し、モデルがシーケンスをより効果的に認識して追跡するのに役立ちます[2]。
- シーケンシャル実行：次のステップに移動する前に各ステップが完全に処理される段階的なアプローチを実装します。これは、プロンプトの関数のような構造を使用することで促進できます[2]。
- 手動介入：必要に応じて、モデルが次のステップに進むように手動で促します。そのようなキューなしでシーケンスを自動的に移動しない可能性があるためです[4]。

引用：
[1] https://cdn.openai.com/gpt-4-5-system-card.pdf
[2] https://www.aifire.co/p/detailed-teps-to-build-multi-custom-custom-gpts-solve-タスク
[3] https://community.openai.com/t/how-to-deal-with-lazy-gpt-4/689286
[4] https://community.openai.com/t/gpt-getting-with-multi-step-instructions/613209
[5] https://www.reddit.com/r/singularity/comments/1izn175/openai_gpt45_system_card/
[6] https://community.openai.com/t/how-to-improve-gpt-4-api-output-ond-cruture/1025132
[7] https://www.reddit.com/r/singularity/comments/1iyrwvd/the_information_confirms_gpt45_this_week/
[8] https://www.reddit.com/r/openai/comments/197exmm/gpt4_has_only_been_getting_worse/

GPT-4.5は、マルチステップの問題における矛盾する指示をどのように処理しますか