ワードフィルターを使用して特定の単語やフレーズを会話から削除する - Amazon Bedrock

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ワードフィルターを使用して特定の単語やフレーズを会話から削除する

Amazon Bedrock ガードレールにはワードフィルターがあり、入力プロンプトやモデルレスポンスで単語やフレーズをブロックするために使用できます。次のワードフィルターを使用して、冒涜的、攻撃的、不適切なコンテンツや、競合相手や製品の名前を含むコンテンツをブロックできます。

  • 冒涜的な表現フィルター - 冒涜的な単語をブロックする場合は、このフィルターを有効にします。冒涜的な表現のリストは、冒涜的な表現についての従来の定義に基づいており、継続的に更新されています。

  • カスタム単語フィルター – 最大 3 つの単語 AWS マネジメントコンソール の を使用してカスタム単語とフレーズをリストに追加します。カスタムのワードフィルターには最大 10,000 個の項目を追加できます。

    Amazon Bedrock AWS マネジメントコンソールを使用して単語とフレーズを追加する場合、次の選択肢があります。

    • テキストエディタで手動で追加する。

    • .txt ファイルまたは .csv ファイルをアップロードする。

    • Amazon S3 バケットからオブジェクトをアップロードする。

    注記

    を使用してのみ、ドキュメントとオブジェクトをアップロードできます AWS マネジメントコンソール。API や SDK のオペレーションはテキストにのみ対応していて、ドキュメントやオブジェクトはアップロードできません。

ガードレールのワードポリシーを設定する

AWS マネジメントコンソール または Amazon Bedrock API を使用して、ガードレールの単語ポリシーを設定できます。

Console
  1. Amazon Bedrock コンソールを使用するアクセス許可を持つ IAM ID AWS マネジメントコンソール を使用して にサインインします。Amazon Bedrock コンソール (https://console.aws.amazon.com/bedrock) を開きます。

  2. 左側のナビゲーションペインで [ガードレール] を選択し、次に [ガードレールを作成] を選択します。

  3. [ガードレールの詳細を提供] ページで、次の操作を行います。

    1. [ガードレールの詳細] セクションで、ガードレールの [名前] とオプションの [説明] に入力します。

    2. [ブロックされたプロンプトのメッセージ] に、ガードレールが適用されたときに表示されるメッセージを入力します。[応答に同じブロックメッセージを適用します] チェックボックスをオンにして、応答でガードレールが適用されたときに同じメッセージを使用します。

    3. (オプション) ガードレールのクロスリージョン推論を有効にするには、[クロスリージョン推論] を展開し、[ガードレールのクロスリージョン推論を有効にする] を選択します。ガードレール推論リクエストをルーティングできる送信先を定義する AWS リージョン ガードレールプロファイルを選択します。

    4. (オプション) デフォルトでは、ガードレールは で暗号化されます AWS マネージドキー。独自のカスタマーマネージド KMS キーを使用するには、[KMS キーの選択] を展開して、[暗号化設定をカスタマイズ (詳細)] チェックボックスをオンにします。

      既存の AWS KMS キーを選択するか、キーの作成を選択して新しい AWS KMS キーを作成できます。

    5. (オプション) ガードレールにタグを追加するには、[タグ] を展開し、定義するタグごとに [新しいタグを追加] を選択します。

      詳細については、「Amazon Bedrock リソースにタグ付け」を参照してください。

    6. [Next] (次へ) を選択します。

  4. [ワードフィルターを追加] ページで、次の操作を行います。

    1. [冒涜的な表現をフィルタリング] を選択して、プロンプトと応答に含まれる冒涜的な表現をブロックします。冒涜的な表現のリストは、従来の定義に基づいており、継続的に更新されています。

    2. [カスタムの単語やフレーズを追加] で、ガードレールでブロックする単語とフレーズを追加する方法を選択します。単語のファイルをアップロードする場合、ファイル内の各行に 1 つの単語または最大 3 つの単語からなる 1 つのフレーズを含める必要があります。ヘッダーは含めないでください。次のオプションがあります。

      オプション 指示
      単語やフレーズを手動で追加 [単語やフレーズを表示および編集] セクションに単語とフレーズを直接追加します。
      ローカルファイルからアップロード 単語とフレーズを含んでいる .txt または .csv ファイルをアップロードするには、このオプションを選択した後に [ファイルを選択] を選択します。
      Amazon S3 オブジェクトからアップロード S3 バケットからオブジェクトをアップロードします。
    3. [単語やフレーズを表示および編集] セクションで、ガードレールでブロックする単語とフレーズを編集します。次のオプションがあります。

      • ローカルファイルまたは Amazon S3 オブジェクトから単語リストをアップロードした場合、このセクションには単語リストが入力されます。エラーのある項目をフィルタリングするには、[エラーを表示] を選択します。

      • 単語リストに項目を追加するには、[単語やフレーズを追加] を選択します。ボックス内に単語または最大 3 つの単語のフレーズを入力し、Enter キーを押すか、チェックマークアイコンを選択して項目を確認します。

      • 項目を編集するには、項目の横にある編集アイコン ( Edit icon represented by a pencil symbol. ) を選択します。

      • 単語リストから項目を削除するには、ごみ箱アイコン ( Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. ) を選択するか、項目を編集する場合は、項目の横にある削除アイコン ( Close or cancel icon represented by an "X" symbol. ) を選択します。

      • エラーが含まれている項目を削除するには、[すべて削除] を選択して、[エラーのあるすべての行を削除] を選択します。

      • すべての項目を削除するには、[すべて削除] を選択して、[すべての行を削除] を選択します。

      • 項目を検索するには、検索バーに式を入力します。

      • エラーが含まれている項目のみを表示するには、[すべて表示] というラベルが付いたドロップダウンメニューを選択し、[エラーのみ表示] を選択します。

      • テーブル内の各ページのサイズまたはテーブル内の列表示を設定するには、設定アイコン ( Gear icon representing settings or configuration options. ) を選択します。設定を行い、[確認] を選択します。

      • デフォルトでは、このセクションに [テーブル] エディタが表示されます。各行に単語またはフレーズを入力できるテキストエディタに切り替えるには、[テキストエディタ] を選択します。[テキストエディタ] には、次の機能があります。

        • 別のテキストエディタから単語リストをコピーして、このエディタに貼り付けることができます。

        • エラーが含まれている項目の横に赤い X アイコンが表示され、エディタの下部にエラーのリストが表示されます。

    4. 必要に応じて [次へ] を選択して他のポリシーを構成するか、[スキップして確認および作成] を選択してガードレールの作成を完了します。

    5. ガードレールの設定を確認します。

      1. 変更するセクションで [編集] を選択します。

      2. ポリシーの設定が完了したら、[作成] を選択してガードレールを作成します。

API

ワードポリシーを使用してガードレールを作成するには、CreateGuardrail リクエストを送信します。リクエストの形式は次のとおりです。

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "wordPolicyConfig": { "managedWordListsConfig": [ { "inputAction": "BLOCK | NONE", "inputEnabled": true, "outputAction": "BLOCK | NONE", "outputEnabled": true, "type": "PROFANITY" }, ], "wordsConfig": [{ "text": "string", "inputAction": "BLOCK | NONE", "inputEnabled": true, "outputAction": "BLOCK | NONE", "outputEnabled": true }] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [{ "key": "string", "value": "string" }], "crossRegionConfig": { "guardrailProfileIdentifier": "string" } }
  • ガードレールの namedescription を指定します。

  • blockedInputMessaging および blockedOutputsMessaging フィールドでプロンプトまたはモデルレスポンスをガードレールが正常にブロックしたときのメッセージを指定します。

  • wordPolicyConfig オブジェクトでワードポリシーを設定します。

    • managedWordListsConfig を使用して、冒涜的な単語の事前定義されたリストを設定します。

    • wordsConfig 配列を使用して、フィルタリングするカスタムの単語とフレーズを指定します。

      • text フィールドでフィルタリングする単語とフレーズを指定します。

      • (オプション) inputAction を使用してプロンプトで単語が検出された場合、または outputAction を使用して応答で単語が検出された場合に実行するアクションを指定します。コンテンツをブロックしてブロックメッセージに置き換える場合は [BLOCK] を選択し、何もアクションを取らずに検出情報を返す場合は [NONE] を選択します。

      • (オプション) inputEnabledoutputEnabled を使用して、入力と出力でガードレール評価を有効にするかどうかを制御します。

  • (オプション) ガードレールにタグをアタッチします。詳細については、「Amazon Bedrock リソースにタグ付け」を参照してください。

  • (オプション) セキュリティのために、kmsKeyId フィールドに KMS キーの ARN を含めます。

  • (オプション) クロスリージョン推論を有効にするには、crossRegionConfig オブジェクトでガードレールプロファイルを指定します。

レスポンスの形式は次のとおりです。

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }