Crie uma grade de proteção

Você cria uma barreira definindo as configurações, definindo tópicos a serem negados, fornecendo filtros para lidar com conteúdo prejudicial e confidencial e escrevendo mensagens para quando as solicitações e as respostas do usuário são bloqueadas.

Uma grade de proteção deve conter pelo menos um filtro e mensagens para quando as solicitações e as respostas do usuário forem bloqueadas. Você pode optar por usar a mensagem padrão. Você pode adicionar filtros e iterar em sua grade de proteção posteriormente, seguindo as etapas em Editar uma grade de proteção para configurar todos os componentes necessários para sua grade de proteção.

Selecione a guia correspondente ao seu método de escolha e siga as etapas.

Console

Para criar uma grade de proteção

Faça login na função AWS Management Console usando uma função do IAM com as permissões do Amazon Bedrock e abra o console do Amazon Bedrock em https://console.aws.amazon.com/bedrock/.
No painel de navegação esquerdo, selecione Guardrails.
Na seção Guardrails, selecione Criar guardrail.
Na página Fornecer detalhes do guarda-corpo, faça o seguinte:
1. Na seção Detalhes do guarda-corpo, forneça um nome e uma descrição opcional para o guarda-corpo.
2. Insira uma mensagem para Mensagens bloqueadas para receber solicitações que serão exibidas quando as grades de proteção forem invocadas. Marque a caixa de seleção Usar a mesma mensagem bloqueada para respostas para usar a mesma mensagem quando as grades de proteção forem invocadas na resposta.
3. (Opcional) Por padrão, sua grade de proteção é criptografada com um. Chave gerenciada pela AWS Para usar sua própria chave KMS gerenciada pelo cliente, selecione a seta para a direita ao lado da seleção da chave KMS e marque a caixa de seleção Personalizar configurações de criptografia (avançadas). Você pode selecionar uma AWS KMS chave existente ou selecionar Criar uma AWS KMS chave para criar uma nova.
4. Para opções de criação de guarda-corpo, selecione Criação rápida com filtros de toxicidade para usar as configurações padrão ou selecione Criar seu próprio guarda-corpo para personalizar suas configurações de guarda-corpo. Você também pode selecionar Exibir e editar filtros de toxicidade para visualizar ou personalizar os palavrões do filtro de proteção e as configurações do filtro de ataque imediato.
5. (Opcional) Para adicionar tags à sua grade de proteção, selecione a seta para a direita ao lado de Tags. Em seguida, selecione Adicionar nova tag e defina pares de valores-chave para suas tags. Para ter mais informações, consulte Marcar recursos.
6. Escolha Próximo.
nota
Você deve configurar pelo menos um filtro para criar uma grade de proteção. Em seguida, você pode selecionar Criar para ignorar a criação de outros filtros.
(Opcional) Na página Configurar filtros de conteúdo, configure com que intensidade você deseja filtrar o conteúdo relacionado às categorias definidas em Filtros de conteúdo fazendo o seguinte:
1. Para configurar filtros para categorias nocivas, selecione Ativar filtro de categorias nocivas. Você pode selecionar o filtro para ataques imediatos nas categorias nocivas. Configure o quão rigoroso você deseja que cada filtro seja para as solicitações que o usuário fornece ao modelo.
2. Para configurar filtros para ataques imediatos, selecione Ativar filtro de ataques imediatos. Configure com que rigor você deseja que o filtro detecte e bloqueie ataques de jailbreak e injeção imediata.
3. Selecione Criar para criar a grade de proteção ou selecione Usar filtros avançados para personalizar as configurações do filtro.
(Opcional) Na página Adicionar tópicos negados, você pode adicionar tópicos negados ou selecionar Ir para revisão e criar.
1. Para definir um tópico a ser bloqueado, selecione Adicionar tópico negado. Então, faça o seguinte:
  1. Insira um Name (Nome) para o tópico.
  2. Na caixa Definição para tópico, defina o tópico. Para obter diretrizes sobre como definir um tópico negado, consulteTópicos negados.
  3. (Opcional) Para adicionar solicitações de entrada representativas ou respostas de modelo relacionadas a esse tópico, selecione a seta para a direita ao lado de Adicionar exemplos de frases. Insira uma frase na caixa. Para adicionar outra frase, selecione Adicionar frase.
  4. Quando terminar de configurar o tópico negado, selecione Confirmar.
2. Você pode realizar as seguintes ações com os tópicos Negados.
  - Para adicionar outro tópico, selecione Adicionar tópico negado.
  - Para editar um tópico, selecione o ícone de três pontos na mesma linha do tópico na coluna Ações. Em seguida, selecione Editar. Depois de terminar a edição, selecione Confirmar.
  - Para excluir um tópico ou tópicos, marque as caixas de seleção dos tópicos a serem excluídos. Selecione Excluir e, em seguida, selecione Excluir selecionado.
  - Para excluir todos os tópicos, selecione Excluir e, em seguida, selecione Excluir tudo.
  - Para configurar o tamanho de cada página na tabela ou a exibição da coluna na tabela, selecione o ícone de configurações ( ). Defina suas preferências e selecione Confirmar.
3. Quando terminar de configurar os tópicos negados, selecione Avançar.

(Opcional) Na página Adicionar filtros de palavras, faça o seguinte:

Na seção Filtrar palavrões, selecione Filtrar palavrões para bloquear palavrões em solicitações e respostas. A lista de palavrões é baseada em definições convencionais e é atualizada continuamente.

Na seção Adicionar palavras e frases personalizadas, selecione como adicionar palavras e frases para bloquear a grade de proteção. Se você optar por carregar um arquivo, cada linha do arquivo deverá conter uma palavra ou uma frase de até três palavras. Não inclua um cabeçalho. Você tem as seguintes opções:

Opção	Instruções
Adicione palavras e frases manualmente	Adicione palavras e frases diretamente na seção Exibir e editar palavras e frases.
Carregar de um arquivo local	Para carregar um arquivo.txt ou .csv contendo as palavras e frases, selecione Escolher arquivo depois de selecionar essa opção.
Carregar do objeto Amazon S3	Para fazer upload de um arquivo do Amazon S3, especifique o objeto do S3 depois de selecionar essa opção. Cada linha no arquivo deve conter uma palavra ou uma frase de até três palavras.

Você edita as palavras e frases a serem bloqueadas na seção Exibir e editar palavras e frases. Você tem as seguintes opções:
- Se você fez upload de uma lista de palavras de um arquivo local ou objeto do Amazon S3, esta seção será preenchida com sua lista de palavras. Para filtrar itens com erros, selecione Mostrar erros.
- Para adicionar um item à lista de palavras, selecione Adicionar palavra ou frase. Insira uma palavra ou frase de até três palavras na caixa e pressione Enter ou selecione o ícone de marca de seleção para confirmar o item.
- Para editar um item, selecione o ícone de edição ( ) ao lado do item.
- Para excluir um item da lista de palavras, selecione o ícone da lixeira ( ) ou, se estiver editando um item, selecione o ícone de exclusão ( ) ao lado do item.
- Para excluir itens que contenham erros, selecione Excluir tudo e, em seguida, selecione Excluir todas as linhas com erro
- Para excluir todos os itens, selecione Excluir tudo e, em seguida, selecione Excluir todas as linhas
- Para pesquisar um item, insira uma expressão na barra de pesquisa.
- Para mostrar somente itens com erros, selecione o menu suspenso Mostrar tudo e selecione Mostrar somente erros.
- Para configurar o tamanho de cada página na tabela ou a exibição da coluna na tabela, selecione o ícone de configurações ( ). Defina suas preferências e selecione Confirmar.
- Por padrão, essa seção exibe o editor de tabela. Para mudar para um editor de texto no qual você possa inserir uma palavra ou frase em cada linha, selecione Editor de texto. O editor de texto fornece os seguintes recursos:
  - Você pode copiar uma lista de palavras de outro editor de texto e colá-la nesse editor.
  - Um ícone X vermelho aparece ao lado dos itens que contêm erros e uma lista de erros aparece abaixo do editor.
Selecione Ignorar para revisar e criar para criar a grade de proteção ou selecione Avançar para adicionar filtros para padrões de PII e regex.

(Opcional) Na página Adicionar filtros de informações confidenciais, configure filtros para bloquear ou mascarar informações confidenciais. Para ter mais informações, consulte Filtros de informações confidenciais. Faça o seguinte:

Na seção Tipos de PII, configure as categorias de informações de identificação pessoal (PII) para bloquear ou mascarar. Você tem as seguintes opções:
- Para adicionar um tipo de PII, selecione Adicionar um tipo de PII. Então, faça o seguinte:
  1. Na coluna Tipo, selecione um tipo de PII.
  2. Na coluna Comportamento do guardrail, selecione se o guardrail deve bloquear o conteúdo contendo o tipo de PII ou mascará-lo com um identificador.
- Para adicionar todos os tipos de PII, selecione a seta suspensa ao lado de Adicionar um tipo de PII. Em seguida, selecione o comportamento do guarda-corpo a ser aplicado a eles.
  
  Atenção
  Se você especificar um comportamento, qualquer comportamento existente que você configurou para tipos de PII será substituído.
- Para excluir um tipo de PII, selecione o ícone da lixeira () .
- Para excluir linhas que contenham erros, selecione Excluir tudo e, em seguida, selecione Excluir todas as linhas com erro
- Para excluir todos os tipos de PII, selecione Excluir tudo e, em seguida, selecione Excluir todas as linhas
- Para pesquisar uma linha, insira uma expressão na barra de pesquisa.
- Para mostrar somente linhas com erros, selecione o menu suspenso Mostrar tudo e selecione Mostrar somente erros.
- Para configurar o tamanho de cada página na tabela ou a exibição da coluna na tabela, selecione o ícone de configurações ( ). Defina suas preferências e selecione Confirmar.

Na seção Padrões Regex, use expressões regulares para definir padrões para a grade de proteção filtrar. Você tem as seguintes opções:

Para adicionar um padrão, selecione Adicionar padrão regex. Configure os campos a seguir.

Campo	Descrição
Nome	Um nome para o padrão
Padrão Regex	Uma expressão regular que define o padrão
Comportamento da proteção	Escolha se deseja bloquear conteúdo contendo o padrão ou mascará-lo com um identificador. Para mascarar o padrão somente em registros, selecione Nenhum.
Adicionar descrição	(Opcional) Escreva uma descrição para o padrão

Para editar um padrão, selecione o ícone de três pontos na mesma linha do tópico na coluna Ações. Em seguida, selecione Editar. Depois de terminar a edição, selecione Confirmar.
Para excluir um padrão ou padrões, marque as caixas de seleção dos padrões a serem excluídos. Selecione Excluir e, em seguida, selecione Excluir selecionado.
Para excluir todos os padrões, selecione Excluir e, em seguida, selecione Excluir tudo.
Para pesquisar um padrão, insira uma expressão na barra de pesquisa.
Para configurar o tamanho de cada página na tabela ou a exibição da coluna na tabela, selecione o ícone de configurações ( ). Defina suas preferências e selecione Confirmar.

Ao terminar de configurar os filtros de informações confidenciais, selecione Avançar ou Ignorar para revisar e criar.

Na página de verificação Adicionar aterramento contextual (opcional), configure limites para bloquear informações não fundamentadas ou irrelevantes.

nota
Para cada tipo de verificação, você pode mover o controle deslizante ou inserir um valor limite de 0 a 0,99. Selecione um limite apropriado para seus usos. Um limite mais alto exige que as respostas sejam fundamentadas ou relevantes, com um alto grau de confiança para serem permitidas. As respostas abaixo do limite serão filtradas. Para saber mais sobre a verificação de aterramento contextual, consulte Verificação de aterramento contextual.
1. No campo Aterramento, selecione Ativar verificação de aterramento para verificar se as respostas do modelo estão aterradas.
2. No campo Relevância, selecione Habilitar verificação de relevância para verificar se as respostas do modelo são relevantes.
3. Escolha Próximo.
Revise e crie — revise as configurações do seu guarda-corpo.
1. Selecione Editar em qualquer seção na qual você deseja fazer alterações.
2. Quando estiver satisfeito com as configurações da sua grade de proteção, selecione Criar para criar a grade de proteção.

API

Para criar uma grade de proteção, envie uma CreateGuardrailsolicitação. O formato da solicitação é o seguinte:


POST /guardrails HTTP/1.1
Content-type: application/json

{
   "blockedInputMessaging": "string",
   "blockedOutputsMessaging": "string",
   "contentPolicyConfig": { 
      "filtersConfig": [ 
         { 
            "inputStrength": "NONE | LOW | MEDIUM | HIGH",
            "outputStrength": "NONE | LOW | MEDIUM | HIGH",
            "type": "SEXUAL | VIOLENCE | HATE | INSULTS | MISCONDUCT | PROMPT_ATTACK"
         }
      ]
   },
    "wordPolicyConfig": {
    "wordsConfig": [
      {
        "text": "string"
      }
    ],
    "managedWordListsConfig": [
      {
        "type": "string"
      }
    ]
  },
  "sensitiveInformationPolicyConfig": {
    "piiEntitiesConfig": [
      {
        "type": "string",
        "action": "string"
      }
    ],
    "regexesConfig": [
      {
        "name": "string",
        "description": "string",
        "regex": "string",
        "action": "string"
      }
    ]
  },
   "description": "string",
   "kmsKeyId": "string",
   "name": "string",
   "tags": [ 
      { 
         "key": "string",
         "value": "string"
      }
   ],
   "topicPolicyConfig": { 
      "topicsConfig": [ 
         { 
            "definition": "string",
            "examples": [ "string" ],
            "name": "string",
            "type": "DENY"
         }
      ]
   }
}

Especifique uma name e description para a grade de proteção.
Especifique mensagens para quando a grade de proteção bloquear com sucesso uma solicitação ou uma resposta do modelo nos campos blockedInputMessaging e. blockedOutputsMessaging
Especifique tópicos para a grade de proteção a ser negada no topicPolicy objeto. Cada item na topics lista pertence a um tópico. Para obter mais informações sobre os campos em um tópico, consulte Tópico.
- Dê uma name ajuda description para que a grade de proteção possa identificar adequadamente o tópico.
- Especifique DENY no action campo.
- (Opcional) Forneça até cinco exemplos que você classificaria como pertencentes ao tópico na examples lista.
Especifique as intensidades do filtro para as categorias nocivas definidas no Amazon Bedrock no contentPolicy objeto. Cada item da filters lista pertence a uma categoria prejudicial. Para ter mais informações, consulte Filtros de conteúdo. Para obter mais informações sobre os campos em um filtro de conteúdo, consulte ContentFilter.
- Especifique a categoria no type campo.
- Especifique a intensidade do filtro para solicitações no strength campo do textToTextFiltersForPrompt campo e para respostas do modelo no strength campo dotextToTextFiltersForResponse.
(Opcional) Anexe todas as etiquetas ao corrimão. Para ter mais informações, consulte Marcar recursos.
(Opcional) Por segurança, inclua o ARN de uma chave KMS no campo. kmsKeyId

O formato da resposta é o seguinte:


HTTP/1.1 202
Content-type: application/json

{
   "createdAt": "string",
   "guardrailArn": "string",
   "guardrailId": "string",
   "version": "string"
}

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Pré-requisitos

Teste uma grade de proteção

Crie uma grade de proteção

Para criar uma grade de proteção

nota

Atenção

nota