Crie uma base de conhecimento conectando-se a uma fonte de dados nas Bases de Conhecimento Amazon Bedrock

Ao criar uma base de conhecimento conectando-se a uma fonte de dados, você configura ou especifica o seguinte:

Informações gerais que definem e identificam a base de conhecimento
A função de serviço com permissões para a base de conhecimento.
Configurações para a base de conhecimento, incluindo o modelo de incorporação a ser usado ao converter dados da fonte de dados, configurações de armazenamento para o serviço no qual armazenar as incorporações e, opcionalmente, um local S3 para armazenar dados multimodais.

nota

Você não pode criar uma base de conhecimento com um usuário-raiz. Faça login com um usuário do IAM antes de iniciar essas etapas.

Expanda a seção que corresponde ao seu caso de uso:

Para configurar uma base de conhecimento

Faça login no AWS Management Console com uma identidade do IAM que tenha permissões para usar o console Amazon Bedrock. Em seguida, abra o console Amazon Bedrock em https://console.aws.amazon.com/bedrock.
No painel de navegação esquerdo, escolha Bases de conhecimento.
Na seção Bases de conhecimento, escolha o botão criar e selecione para criar uma base de conhecimento com um armazenamento vetorial.
(Opcional) Altere o nome padrão e forneça uma descrição para sua base de conhecimento.
Escolha uma função AWS Identity and Access Management (IAM) que forneça permissão ao Amazon Bedrock para acessar outros AWS serviços necessários. Você pode deixar o Amazon Bedrock criar a função de serviço ou optar por usar sua própria função personalizada que você criou para o Neptune Analytics.
Escolha uma fonte de dados à qual conectar sua base de conhecimento.
(Opcional) Adicione tags à base de conhecimento. Para obter mais informações, consulte Marcação de recursos do Amazon Bedrock.
(Opcional) Configure serviços para os quais fornecer registros de atividades para sua base de conhecimento.
Vá para a próxima seção e siga as etapas em Conecte uma fonte de dados à sua base de conhecimento para configurar uma fonte de dados.
Na seção Modelo de incorporação, faça o seguinte:
1. Escolha um modelo de incorporação para converter seus dados em incorporações vetoriais.
2. (Opcional) Expanda a seção Configurações adicionais para ver as seguintes opções de configuração (nem todos os modelos comportam todas as configurações):
  - Tipo de incorporação: se deseja converter os dados em incorporações de vetores de ponto flutuante (float32) (mais precisas, mas mais caras) ou incorporações de vetores binários (menos precisas, mas menos caras). Para saber quais modelos de incorporação oferecem suporte a vetores binários, consulte os modelos de incorporação compatíveis.
  - Dimensões vetoriais — Valores mais altos melhoram a precisão, mas aumentam o custo e a latência.
Na seção Banco de dados vetoriais, faça o seguinte:
1. Escolha um repositório de vetores para armazenar as incorporações vetoriais que serão usadas para consulta. Você tem as seguintes opções:
  - Crie rapidamente uma nova loja de vetores — escolha uma das lojas de vetores disponíveis para o Amazon Bedrock criar. Você também pode configurar opcionalmente a criptografia de AWS KMS chave para seu armazenamento de vetores.
    
    nota
    Ao usar essa opção, o Amazon Bedrock gerencia automaticamente o posicionamento dos metadados para cada armazenamento de vetores.
    Amazon OpenSearch Serverless — O Amazon Bedrock Knowledge Bases cria uma coleção e um índice de pesquisa vetorial Amazon OpenSearch Serverless e os configura com os campos obrigatórios para você.
    
    Amazon Aurora PostgreSQL Serverless — O Amazon Bedrock configura um armazenamento vetorial Amazon Aurora PostgreSQL Serverless. Esse processo pega dados de texto não estruturados de um bucket do Amazon S3, os transforma em blocos de texto e vetores e, em seguida, os armazena em um banco de dados PostgreSQL. Para obter mais informações, consulte Criação rápida de uma base de conhecimento do Aurora PostgreSQL para o Amazon Bedrock.
    
    Amazon Neptune Analytics — O Amazon Bedrock usa técnicas de geração aumentada de recuperação (RAG) combinadas com gráficos para aprimorar aplicativos de IA generativa para que os usuários finais possam obter respostas mais precisas e abrangentes.
    
    Amazon S3 Vectors — O Amazon Bedrock Knowledge Bases cria um bucket vetorial S3 e um índice vetorial que armazenará as incorporações geradas a partir de suas fontes de dados.
    
    Importante
    A integração do Amazon S3 Vectors com as bases de conhecimento do Amazon Bedrock está em versão prévia e está sujeita a alterações.
    
    Você pode criar uma base de conhecimento para os vetores do Amazon S3 em todos os Região da AWS países em que os vetores Amazon Bedrock e Amazon S3 estão disponíveis. Para obter informações sobre a disponibilidade da região, consulte Amazon S3 Vectors no Guia do usuário do Amazon S3.
    
    nota
    Quando o Amazon Bedrock Knowledge Bases cria um índice vetorial para você, ele pode anexar até 40 KB de metadados para cada vetor. Dentro desses 40 KB, até um máximo de 2 KB podem ser usados como metadados filtráveis.
    O Amazon Bedrock armazenará o texto no espaço não filtrável como chave. AMAZON_BEDROCK_TEXT Os metadados adicionados pelo Amazon Bedrock são armazenados no espaço de metadados filtrável. Para obter mais informações sobre as limitações de metadados do bucket vetorial do S3, consulte Pré-requisitos para usar os vetores do Amazon S3 com as bases de conhecimento do Amazon Bedrock.
  - Escolha um armazenamento vetorial que você criou — Selecione um armazenamento vetorial compatível e identifique os nomes dos campos vetoriais e os nomes dos campos de metadados no índice vetorial. Para obter mais informações, consulte Pré-requisitos para usar um repositório de vetores que você criou para uma base de conhecimento.
    
    nota
    Se sua fonte de dados for uma instância do Confluence SharePoint, Microsoft ou Salesforce, o único serviço de armazenamento vetorial compatível é o Amazon Serverless. OpenSearch
2. (Opcional) Expanda a seção Configurações adicionais e modifique todas as configurações relevantes.
Se sua fonte de dados contiver imagens, especifique um URI do Amazon S3 para armazenar as imagens que o analisador extrairá dos dados no destino de armazenamento multimodal. As imagens podem ser retornadas durante a consulta. Opcionalmente, você também pode escolher uma chave gerenciada pelo cliente em vez da padrão Chave gerenciada pela AWS para criptografar seus dados.

nota
Os dados multimodais só são compatíveis com o Amazon S3 e fontes de dados personalizadas.
Escolha Avançar e revise os detalhes da sua base de conhecimento. É possível editar qualquer seção antes de começar a criar a base de conhecimento.

nota
O tempo necessário para criar a base de conhecimento depende de suas configurações específicas. Quando a criação da base de conhecimento é concluída, o status da base de conhecimento muda para o estado pronto ou disponível.
Quando a base de conhecimento estiver pronta e disponível, sincronize a fonte de dados pela primeira vez e sempre que quiser manter o conteúdo atualizado. Selecione a base de conhecimento no console e escolha Sincronizar na seção de visão geral da fonte de dados.

Para criar uma base de conhecimento, envie uma CreateKnowledgeBasesolicitação com um endpoint de tempo de construção do Agents for Amazon Bedrock.

nota

Se você preferir permitir que o Amazon Bedrock crie e gerencie um armazenamento de vetores para você, use o console. Para obter mais informações, expanda a seção Usar o console neste tópico.

Os campos a seguir são obrigatórios:

Campo	Descrição básica
nome	Um nome para a base de conhecimento
roleArn	O ARN de uma função de serviço da Amazon Bedrock Knowledge Bases.
knowledgeBaseConfiguration	Contém configurações para a base de conhecimento. Veja os detalhes abaixo.
Configuração de armazenamento	(Exigido somente se você estiver se conectando a uma fonte de dados não estruturada).Contém configurações para o serviço de fonte de dados que você escolher.

Os seguintes campos são opcionais:

Campo	Caso de uso
description	Uma descrição para a base de conhecimento.
clientToken	Para garantir que a solicitação de API seja concluída apenas uma vez. Para obter mais informações, consulte Ensuring idempotency.
tags	Para associar tags ao fluxo. Para obter mais informações, consulte Marcação de recursos do Amazon Bedrock.

No knowledgeBaseConfiguration campo, que mapeia para um KnowledgeBaseConfigurationobjeto, especifique VECTOR no type campo e inclua um VectorKnowledgeBaseConfigurationobjeto. No objeto, inclua os seguintes campos:

embeddingModelArn— O ARN do modelo de incorporação a ser usado.
embeddingModelConfiguration— Configurações para o modelo de incorporação. Para ver os valores possíveis que você pode especificar para cada modelo compatível, consulteModelos e regiões compatíveis com as bases de conhecimento do Amazon Bedrock.
(Se você planeja incluir dados multimodais, que incluem imagens, figuras, gráficos ou tabelas, em sua base de conhecimento) supplementalDataStorageConfiguration — Mapeia para um SupplementalDataStorageLocationobjeto, no qual você especifica o local do S3 no qual armazenar os dados extraídos. Para obter mais informações, consulte Opções de análise para sua fonte de dados.

No storageConfiguration campo, que mapeia para um StorageConfigurationobjeto, especifique o armazenamento de vetores ao qual você planeja se conectar no type campo e inclua o campo que corresponde a esse armazenamento de vetores. Consulte cada tipo de configuração de armazenamento de vetores em StorageConfigurationpara obter detalhes sobre as informações que você precisa fornecer.

Veja a seguir um exemplo de solicitação para criar uma base de conhecimento conectada a uma coleção Amazon OpenSearch Serverless. Os dados das fontes de dados conectadas serão convertidos em incorporações vetoriais binárias com a Amazon Titan Text Embeddings V2 e os dados multimodais extraídos pelo analisador serão configurados para serem armazenados em um bucket chamado. MyBucket


PUT /knowledgebases/ HTTP/1.1
Content-type: application/json

{
   "name": "MyKB",
   "description": "My knowledge base",
   "roleArn": "arn:aws:iam::111122223333:role/service-role/AmazonBedrockExecutionRoleForKnowledgeBase_123",
   "knowledgeBaseConfiguration": {
      "type": "VECTOR",
      "vectorKnowledgeBaseConfiguration": { 
         "embeddingModelArn": "arn:aws:bedrock:us-east-1::foundation-model/amazon.titan-embed-text-v2:0",
         "embeddingModelConfiguration": { 
            "bedrockEmbeddingModelConfiguration": { 
               "dimensions": 1024,
               "embeddingDataType": "BINARY"
            }
         },
         "supplementalDataStorageConfiguration": { 
            "storageLocations": [ 
               { 
                  "s3Location": { 
                     "uri": "arn:aws:s3:::MyBucket"
                  },
                  "type": "S3"
               }
            ]
         }
      }
   },
   "storageConfiguration": { 
      "opensearchServerlessConfiguration": { 
         "collectionArn": "arn:aws:aoss:us-east-1:111122223333:collection/abcdefghij1234567890",
         "fieldMapping": { 
            "metadataField": "metadata",
            "textField": "text",
            "vectorField": "vector"
         },
         "vectorIndexName": "MyVectorIndex"
      }
   }
}

Tópicos

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Configurando OpenSearch permissões com controle de acesso refinado

Conectar uma fonte de dados

Crie uma base de conhecimento conectando-se a uma fonte de dados nas Bases de Conhecimento Amazon Bedrock

nota

Para configurar uma base de conhecimento

nota

Importante

nota

nota

nota

nota

nota

Tópicos