创建护栏 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建护栏

您可以通过设置配置、定义要拒绝的主题、提供用于处理有害和敏感内容的过滤器以及为何时阻止提示和用户响应编写消息来创建防护栏。

当提示和用户响应被屏蔽时,护栏必须包含至少一个过滤器和消息。您可以选择使用默认消息。您可以添加过滤器并在以后迭代护栏,方法是按照中的步骤配置护栏所需的所有组件编辑护栏

选择与您选择的方法相对应的选项卡,然后按照步骤操作。

Console
创建护栏
  1. AWS Management Console 使用具有 Amazon Bedrock 权限的 IAM 角色登录,然后通过 https://console.aws.amazon.com/bedrock/ 打开亚马逊 Bedrock 控制台。

  2. 在左侧导航窗格中,选择 “护栏”。

  3. 护栏部分,选择创建护栏

  4. 提供护栏详细信息页面上,执行以下操作:

    1. 护栏详细信息部分,提供护栏的名称和可选描述

    2. 在 “已屏蔽的消息” 中输入一条消息,提示将在调用护栏时显示。选中 “对响应使用相同的屏蔽消息” 复选框,以便在对响应调用防护栏时使用相同的消息。

    3. (可选)默认情况下,您的护栏使用加密。 AWS 托管式密钥要使用您自己的客户管理的 KMS 密钥,请选择 KM S 密钥选择旁边的右箭头,然后选自定义加密设置(高级)复选框。您可以选择现有 AWS KMS 密钥或选择创建 AWS KMS 密钥来创建新密钥。

    4. 对于护栏创建选项,请选择使用毒性过滤器快速创建以使用默认设置,或者选择创建自己的护栏以自定义护栏设置。您也可以选择查看和编辑毒性过滤器来查看或自定义您的护栏过滤器的亵渎内容和提示攻击过滤器设置。

    5. (可选)要向护栏添加标签,请选择标签旁边的右箭头。然后,选择添加新标签并为标签定义键值对。有关更多信息,请参阅 标记资源

    6. 选择 下一步

    注意

    您必须配置至少一个过滤器才能创建护栏。然后,您可以选择 “创建” 来跳过其他筛选器的创建。

  5. (可选)在配置内容过滤器页面上,内容过滤器通过执行以下操作来设置筛选出与中定义的类别相关的内容的程度:

    1. 要为有害类别配置过滤器,请选择启用有害类别过滤器。您可以为有害类别中的提示攻击选择过滤器。配置您希望每个过滤器对用户向模型提供的提示的严格程度。

    2. 要为提示攻击配置过滤器,请选择启用提示攻击过滤器。配置您希望过滤器检测和阻止越狱和提示注入攻击的严格程度。

    3. 选择 “创建” 以创建护栏,或者选择 “使用高级过滤器” 来自定义过滤器设置。

  6. (可选)在 “添加被拒绝的话题” 页面上,您可以添加被拒绝的话题或选择 “跳至查看并创建”。

    1. 要定义要屏蔽的主题,请选择添加被拒绝的主题。然后执行以下操作:

      1. 输入主题的名称

      2. 在 “主题的定义” 框中,定义主题。有关如何定义被拒绝主题的指南,请参阅被拒绝的话题

      3. (可选)要添加与此主题相关的代表性输入提示或模型响应,请选择 “添加示例短语” 旁边的右箭头。在框中输入一个短语。要添加其他短语,请选择 “添加短语”。

      4. 配置完被拒绝的主题后,选择确认

    2. 您可以对 “已拒绝” 主题执行以下操作。

      • 要添加其他主题,请选择添加被拒绝的主题

      • 要编辑主题,请在 “操作” 列中选择与该主题位于同一行中的三个点图标。然后选择 “编辑”。完成编辑后,选择确认

      • 要删除一个或多个主题,请选中要删除的主题对应的复选框。选择 “删除”,然后选择 “删除选定项”。

      • 要删除所有主题,请选择删除,然后选择全部删除

      • 要配置表格中每页的大小或表格中显示的列,请选择设置图标 ( Gear icon representing settings or configuration options. )。设置您的首选项,然后选择 “确认”。

    3. 配置完被拒绝的主题后,选择下一步

  7. (可选)在 “添加字词过滤器” 页面上,执行以下操作:

    1. 在 “筛选亵渎内容” 部分,选择 “筛选亵渎内容” 以屏蔽提示和回复中的亵渎内容。亵渎清单基于传统定义,并且会不断更新。

    2. 在 “添加自定义单词和短语” 部分中,选择如何添加要屏蔽的单词和短语。如果您选择上传文件,则文件中的每一行应包含一个单词或一个最多包含三个单词的短语。不要包含标题。您有以下选项:

      选项 说明
      手动添加单词和短语 在 “查看和编辑单词和短语” 部分直接添加单词和短语
      从本地文件上传 要上传包含单词和短语的.txt 或.csv 文件,请在选择此选项后选择 “选择文件”。
      从亚马逊 S3 对象上传 要从 Amazon S3 上传文件,请在选择此选项后指定 S3 对象。文件中的每一行都应包含一个单词或一个最多包含三个单词的短语。
    3. 您可以在 “查看和编辑单词和短语” 部分编辑要屏蔽的单词和短语。您有以下选项:

      • 如果您从本地文件或 Amazon S3 对象上传了单词列表,则此部分将填充您的单词列表。要筛选出有错误的项目,请选择显示错误

      • 要向单词列表中添加项目,请选择 “添加单词或短语”。在框中输入一个单词或一个最多包含三个单词的短语,然后按 Enter 键或选择勾号图标以确认该项目。

      • 要编辑项目,请选择该项目旁边的编辑图标 ( Edit icon represented by a pencil symbol. )。

      • 要从单词列表中删除项目,请选择垃圾桶图标 ( Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. ),或者,如果您正在编辑项目,请选择该项目旁边的删除图标 ( Close or cancel icon represented by an "X" symbol. )。

      • 要删除包含错误的项目,请选择全部删除,然后选择删除所有有错误的行

      • 要删除所有项目,请选择全部删除,然后选择删除所有行

      • 要搜索项目,请在搜索栏中输入表达式。

      • 要仅显示有错误的项目,请选择标有 “全部显示” 的下拉菜单,然后选择 “仅显示错误”。

      • 要配置表格中每页的大小或表格中显示的列,请选择设置图标 ( Gear icon representing settings or configuration options. )。设置您的首选项,然后选择 “确认”。

      • 默认情况下,此部分显示表格编辑器。要切换到可以在每行中输入单词或短语的文本编辑器,请选择文本编辑器文本编辑器提供以下功能:

        • 您可以从其他文本编辑器中复制单词列表并将其粘贴到该编辑器中。

        • 包含错误的项目旁边会出现一个红色 X 图标,错误列表出现在编辑器下方。

    4. 选择 “跳过” 以查看并创建以创建护栏,或者选择 “下一步” 为 PII 和正则表达式模式添加筛选器。

  8. (可选)在 “添加敏感信息过滤器” 页面上,配置过滤器以屏蔽或屏蔽敏感信息。有关更多信息,请参阅 敏感信息过滤器。执行以下操作:

    1. PII 类型部分,配置要屏蔽或屏蔽的个人身份信息 (PII) 类别。您有以下选项:

      • 要添加 PII 类型,请选择添加 PII 类型。然后执行以下操作:

        1. 在 “类型” 列中,选择 PII 类型。

        2. 在 “护栏行为” 列中,选择护栏是应屏蔽包含 PII 类型的内容,还是使用标识符将其盖。

      • 要添加所有 PII 类型,请选择 “添加 PII 类型” 旁边的下拉箭头。然后选择要应用于它们的护栏行为。

        警告

        如果您指定行为,则您为 PII 类型配置的任何现有行为都将被覆盖。

      • 要删除 PII 类型,请选择垃圾桶图标 ( Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. )。

      • 要删除包含错误的行,请选择 “全部删除”,然后选择 “删除所有有错误的行

      • 要删除所有 PII 类型,请选择全部删除,然后选择删除所有行

      • 要搜索行,请在搜索栏中输入表达式。

      • 要仅显示有错误的行,请选择标有 “全部显示” 的下拉菜单,然后选择 “仅显示错误”。

      • 要配置表格中每页的大小或表格中显示的列,请选择设置图标 ( Gear icon representing settings or configuration options. )。设置您的首选项,然后选择 “确认”。

    2. 在正则表达式模式部分,使用正则表达式定义护栏要过滤的模式。您有以下选项:

      • 要添加模式,请选择添加正则表达式模式。配置以下字段:

        字段 描述
        名称 图案的名称
        正则表达式模式 定义模式的正则表达式
        防护机制行为 选择是屏蔽包含该图案的内容,还是使用标识符对其进行盖。要仅在日志中屏蔽模式,请选择 “”。
        添加描述 (可选)写下模式的描述
      • 要编辑模式,请在 “操作” 列中选择与主题同行的三个点图标。然后选择 “编辑”。完成编辑后,选择确认

      • 要删除一个或多个图案,请选中要删除的图案对应的复选框。选择 “删除”,然后选择 “删除选定项”。

      • 要删除所有模式,请选择 “删除”,然后选择 “全部删除”。

      • 要搜索模式,请在搜索栏中输入表达式。

      • 要配置表格中每页的大小或表格中显示的列,请选择设置图标 ( Gear icon representing settings or configuration options. )。设置您的首选项,然后选择 “确认”。

    3. 配置完敏感信息过滤器后,选择 “下一步” 或 “跳过” 以查看和创建

  9. 添加上下文接地检查页面(可选)上,配置阈值以屏蔽未接地或不相关的信息。

    注意

    对于每种类型的检查,您可以移动滑块或输入介于 0 到 0.99 之间的阈值。为您的使用选择合适的阈值。较高的阈值要求响应必须扎根或相关,并具有很高的可信度。低于阈值的响应将被过滤。要了解有关上下文接地检查的更多信息,请参阅上下文接地检查。

    1. 在 “接地” 字段中,选择 “启用接地检查” 以检查模型响应是否接地。

    2. 相关性字段中,选择启用相关性检查以检查模型响应是否相关。

    3. 选择下一步

  10. 查看并创建-查看护栏的设置。

    1. 在要更改的任意部分中选择 “编辑”。

    2. 如果您对护栏的设置感到满意,请选择 “创建” 来创建护栏。

API

要创建护栏,请发送请求。CreateGuardrail请求格式如下:

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "contentPolicyConfig": { "filtersConfig": [ { "inputStrength": "NONE | LOW | MEDIUM | HIGH", "outputStrength": "NONE | LOW | MEDIUM | HIGH", "type": "SEXUAL | VIOLENCE | HATE | INSULTS | MISCONDUCT | PROMPT_ATTACK" } ] }, "wordPolicyConfig": { "wordsConfig": [ { "text": "string" } ], "managedWordListsConfig": [ { "type": "string" } ] }, "sensitiveInformationPolicyConfig": { "piiEntitiesConfig": [ { "type": "string", "action": "string" } ], "regexesConfig": [ { "name": "string", "description": "string", "regex": "string", "action": "string" } ] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [ { "key": "string", "value": "string" } ], "topicPolicyConfig": { "topicsConfig": [ { "definition": "string", "examples": [ "string" ], "name": "string", "type": "DENY" } ] } }
  • description为护栏指定name和。

  • 在和字段中指定护栏成功屏蔽提示或模型响应时的消息。blockedInputMessaging blockedOutputsMessaging

  • 为对象中的护栏指定要拒绝的主题。topicPolicytopics列表中的每个项目都与一个主题相关。有关主题中字段的更多信息,请参阅主题

    • 给一个 name an description d,这样护栏就可以正确识别话题。

    • action字段DENY中指定。

    • (可选)最多提供五个示例,将其归类为属于examples列表中的主题。

  • contentPolicy对象中为 Amazon Bedrock 中定义的有害类别指定过滤强度。filters列表中的每一项都属于一个有害类别。有关更多信息,请参阅 内容过滤器。有关内容过滤器中字段的更多信息,请参阅ContentFilter

    • type字段中指定类别。

    • 为字段中的提示和strengthtextToTextFiltersForPrompt字段中的模型响应指定过滤器的强度textToTextFiltersForResponsestrength

  • (可选)在护栏上贴上任何标签。有关更多信息,请参阅 标记资源

  • (可选)为了安全起见,请在字段中包含 KMS 密钥的 ARN。kmsKeyId

响应格式如下:

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }