DeepSeek-R1モデルのカスタムガードレールの作成には、いくつかのステップが含まれ、Amazon Bedrockの機能を活用して、生成AIアプリケーションの安全性と制御を強化します。これらのガードレールを実装する方法に関する詳細なガイドを次に示します。
##前提条件
GuardRailsをセットアップする前に、Amazon Bedrockと必要なIAM許可にアクセスできるAWSアカウントがあることを確認してください。さらに、Amazon Bedrockのカスタムモデルインポート機能[4]を使用して、DeepSeek-R1モデルを既にインポートする必要があります。
##ステップ1:環境のセットアップ
1. Amazon Bedrockにアクセス:Amazon Bedrockコンソールに移動し、DeepSeek-R1モデルにアクセスできるようにします。
2。依存関係のインストール:Jupyterノートブックまたは同様の環境を使用して、必要な依存関係をインストールします。これは、AWSサービスとの対話のために「boto3」のようなpythonライブラリを使用して実行できます[4]。
##ステップ2:ガードレールの構成
1.ガードレールを作成する:「boto3」を介してAWS管理コンソールまたはプログラムアプローチを使用して、ガードレールを作成します。これには、コンテンツフィルター、トピックフィルター、単語フィルター、機密情報フィルターなど、特定のユースケースに合わせたポリシーを定義することが含まれます[2] [4]。
2。フィルターの構成:たとえば、ヘルスケアの状況で作業している場合、「ヘルスケアコンテンツフィルター」と呼ばれるガードレールを作成する場合があります。入力と出力の両方のフィルター強度を、憎しみ、in辱、性的内容、暴力などのカテゴリの「高」に設定します[1]。
3.プロンプトガードを有効にする:ガードレールを実装して、モデルに到達する前に有害または不適切なプロンプトを検出およびブロックするように構成することにより、迅速な攻撃を防止します[3] [4]。
##ステップ3:ガードレールのテスト
1.モデルAPIを呼び出します:「InvokeModel API」を使用してガードレールをテストします。これには、モデルと対話するために、トークナイザーと岩盤のランタイムクライアントを初期化することが含まれます[1]。
2。テストケースの実行:モデルからの生の応答を観察するために、ガードレールなしのシナリオから始めます。次に、Guardrailsを使用して同じプロンプトを再実行して、不適切なコンテンツを介入してブロックする方法を確認できます[1]。
3。パフォーマンスの評価:ガードレールは、限られたトピックや機密情報などのさまざまな入力に対してテストして、有害なコンテンツを正しく識別してブロックするようにすることにより、ガードレールの有効性を評価します[4]。
##ステップ4:ガードレールの精製
1.フィルターの調整:テスト結果に基づいて、フィルター強度を調整するか、必要に応じて新しいフィルターを追加して、ユースケースの要件をよりよく一致させることにより、ガードレールポリシーを改善します[7]。
2。ブロックされたメッセージング:GuardRailsが介入したときに適切な応答を提供するようにブロックされたメッセージングを構成し、安全基準を維持しながらシームレスなユーザーエクスペリエンスを確保します[7]。
## 結論
Amazon Bedrockを使用してDeepSeek-R1のカスタムガードレールを実装すると、ユーザーの入力とモデル出力を堅牢に制御することにより、AIアプリケーションの安全性と信頼性が向上します。このプロセスにより、生成的なAIの展開は、特定の安全基準と規制要件に準拠し、より信頼できる安全性を高めることができます。
引用:
[1] https://www.youtube.com/watch?v=dv42vlp-rmg
[2] https://repost.aws/questions/qum-c06qe1r6ev6bnsdbetga/bedrock-guardrails-with-deepseek
[3] https://www.trendmicro.com/en_gb/research/25/c/exploiting-deepseek-r1.html
[4] https://aws.amazon.com/blogs/machine-learning/protect-your-deepseek-model-deployments-with-amazon-bedrock-guardrails/
[5] https://aws.amazon.com/blogs/machine-learning/deploy-deepseek-r1-distill-lama-models with-amazon-bedrock-custom-model-import/
[6] https://www.reddit.com/r/openai/comments/1i5pr7q/it_just_happened_deepseekr1_is_here/
[7] https://aws.amazon.com/blogs/aws/deepseek-r1-now-asas-as-as-as-ase- fuly-managed-model-in-amazon-bedrock/
[8] https://www.youtube.com/watch?v=w3fbsyfevz4
[9] https://www.solo.io/blog/navigating-deepseek-r1-security-concerns-and-guardrails