Amazon RDS/Aurora - Amazon Kendra

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Amazon RDS/Aurora

Você pode indexar documentos armazenados em um banco de dados usando uma fonte de dados do banco de dados. Depois de fornecer as informações de conexão para o banco de dados, Amazon Kendra conecta e indexa os documentos.

Amazon Kendra suporta os seguintes bancos de dados:

  • Amazon Aurora MySQL

  • Amazon Aurora PostgreSQL

  • Amazon RDS para MySQL

  • Amazon RDS para PostgreSQL

nota

Não há suporte para bancos de dados do Aurora com tecnologia sem servidor.

Importante

Esse conector Amazon RDS/Aurora está programado para ser descontinuado até o final de 2023.

Amazon Kendra agora oferece suporte a novos conectores de fonte de dados de banco de dados. Para uma experiência aprimorada, recomendamos escolher entre os seguintes novos conectores para seu caso de uso:

Você pode se conectar Amazon Kendra à sua fonte de dados do banco de dados usando o Amazon Kendra console e a DatabaseConfigurationAPI.

Para solucionar problemas do conector da fonte de dados do Amazon Kendra banco de dados, consulteSolucionar problemas de origens de dados.

Atributos compatíveis

Amazon Kendra o conector de fonte de dados do banco de dados oferece suporte aos seguintes recursos:

  • Mapeamentos de campos

  • Filtragem de contexto do usuário

  • Nuvem privada virtual (VPC)

Pré-requisitos

Antes de poder usar Amazon Kendra para indexar sua fonte de dados do banco de dados, faça essas alterações no banco de dados e AWS nas contas.

No banco de dados, verifique se você:

  • Anotou as credenciais básicas de autenticação do nome de usuário e senha no banco de dados.

  • Copiou o nome do host, o número da porta, o endereço do host, o nome do banco de dados e o nome da tabela de dados que contém os dados do documento. Para o PostgreSQL, a tabela de dados deve ser uma tabela pública ou um esquema público.

    nota

    O host e a porta informam Amazon Kendra onde encontrar o servidor de banco de dados na Internet. O nome do banco de dados e o nome da tabela informam Amazon Kendra onde encontrar os dados do documento no servidor do banco de dados.

  • Copiou os nomes das colunas na tabela de dados que contêm os dados do documento. Inclua o ID do documento, o corpo do documento, as colunas para detectar se um documento foi alterado (por exemplo, a última coluna atualizada) e as colunas opcionais da tabela de dados que foram mapeadas para campos de índice personalizados. Você também pode mapear qualquer nome de campo reservado do Amazon Kendra para uma coluna da tabela.

  • Copiou as informações do tipo de mecanismo de banco de dados, como se você usa Amazon RDS para MySQL ou outro tipo.

  • Verificou se cada documento é exclusivo no banco de dados e em outras fontes de dados que você planeja usar para o mesmo índice. Cada fonte de dados que você deseja usar para um índice não deve conter o mesmo documento em todas as fontes de dados. Os IDs de documentos são globais para um índice e devem ser exclusivos por índice.

No seu Conta da AWS, verifique se você tem:

  • Criou um Amazon Kendra índice e, se estiver usando a API, anotei o ID do índice.

  • Criou uma IAM função para sua fonte de dados e, se estiver usando a API, anotei o ARN da IAM função.

    nota

    Se você alterar o tipo de autenticação e as credenciais, deverá atualizar sua IAM função para acessar a ID AWS Secrets Manager secreta correta.

  • Armazenou suas credenciais de autenticação do banco de dados em uma senha do AWS Secrets Manager e, se estiver usando a API, anotou o ARN da senha.

    nota

    Recomendamos que você atualize ou alterne regularmente as credenciais e as senhas. Forneça somente o nível de acesso necessário para sua própria segurança. Não recomendamos que você reutilize credenciais e senhas nas fontes de dados e nas versões 1.0 e 2.0 do conector (quando for aplicável).

Se você não tiver uma IAM função ou segredo existente, poderá usar o console para criar uma nova IAM função e Secrets Manager segredo ao conectar sua fonte de dados do banco de dados Amazon Kendra a. Se você estiver usando a API, deverá fornecer o ARN de uma IAM função e Secrets Manager segredo existentes e um ID de índice.

Instruções de conexão

Para se conectar Amazon Kendra à fonte de dados do banco de dados, você deve fornecer os detalhes necessários da fonte de dados do banco de dados para que Amazon Kendra possa acessar seus dados. Se você ainda não configurou o banco de dados para Amazon Kendra, consultePré-requisitos.

Console

Para se conectar Amazon Kendra a um banco de dados

  1. Faça login no AWS Management Console e abra o Amazon Kendra console.

  2. No painel de navegação esquerdo, escolha Índices e, em seguida, escolha o índice que deseja usar na lista de índices.

    nota

    Você pode escolher definir ou editar as configurações de Controle de acesso do usuário em Configurações do índice.

  3. Na página Introdução, escolha Adicionar fonte de dados.

  4. Na página Adicionar fonte de dados, escolha conector de banco de dados e, em seguida, escolha Adicionar conector. Se estiver usando a versão 2 (se aplicável), escolha o conector de banco de dados com a tag “V2.0".

  5. Na página Especar detalhes da fonte de dados, insira as seguintes informações:

    1. Em Nome e descrição, em Nome da fonte de dados: insira um nome para a fonte de dados. Você pode incluir hífens, mas não espaços.

    2. (Opcional) Descrição: insira uma descrição opcional para a fonte de dados.

    3. Em Idioma padrão — Escolha um idioma para filtrar seus documentos para o índice. A menos que você especifique o contrário, o idioma padrão é o inglês. O idioma especificado nos metadados do documento substitui o idioma selecionado.

    4. Em Tags, em Adicionar nova tag — Inclua tags opcionais para pesquisar e filtrar seus recursos ou monitorar seus AWS custos.

    5. Escolha Próximo.

  6. Na página Definir seção e segurança, insira as informações a seguir:

    1. Endpoint: um nome de host DNS, um endereço IPv4 ou um endereço IPv6.

    2. Porta: um número de porta.

    3. Banco de dados: nome do banco de dados.

    4. Nome da tabela: nome da tabela.

    5. Em Tipo de autenticação, escolha entre Existente e Novo para armazenar as credenciais de autenticação do banco de dados. Se optar por criar uma nova senha, uma janela secreta do AWS Secrets Manager será aberta.

      1. Insira as seguintes informações em Criar uma janela de senha do AWS Secrets Manager :

        1. Senha: um nome para sua senha. O prefixo 'AmazonKendra-database-' é adicionado automaticamente ao seu nome secreto.

        2. Em Nome de usuário e Senha, insira os valores da credencial de autenticação que você copiou do banco de dados.

        3. Escolha Salvar autenticação.

    6. Nuvem privada virtual (VPC): você pode escolher usar uma VPC. Nesse caso, você deve adicionar sub-redes e grupos de segurança da VPC.

      nota

      Você deve usar uma sub-rede privada. Se sua instância do RDS estiver em uma sub-rede pública na VPC, crie uma sub-rede privada que tenha acesso de saída a um gateway NAT na sub-rede pública. As sub-redes fornecidas na configuração da VPC devem estar nas regiões Oeste dos EUA (Oregon), Leste dos EUA (N. da Virgínia), Leste dos EUA (N. da Virgínia) e UE (Irlanda).

    7. IAM função — Escolha uma IAM função existente ou crie uma nova IAM função para acessar as credenciais do repositório e indexar o conteúdo.

      nota

      IAM as funções usadas para índices não podem ser usadas para fontes de dados. Se você não tiver certeza se uma função existente é usada para um índice ou perguntas frequentes, escolha Criar uma nova função para evitar erros.

    8. Escolha Próximo.

  7. Na página Configurar configurações de sincronização, insira as seguintes informações:

    1. Selecione entre Aurora MySQL, MySQL, Aurora PostgreSQL e PostgreSQL com base no seu caso de uso.

    2. Coloque os identificadores SQL entre aspas duplas: selecione para colocar os identificadores SQL entre aspas duplas. Por exemplo, “ColumnName”.

    3. Coluna ACL e colunas de detecção de alterações — Configure as colunas Amazon Kendra usadas para detecção de alterações (por exemplo, a última coluna atualizada) e sua lista de controle de acesso.

    4. Em Cronograma de execução da sincronização, em Frequência — Escolha com que frequência Amazon Kendra será sincronizada com sua fonte de dados.

    5. Escolha Próximo.

  8. Na página Definir mapeamentos de campo, insira as seguintes informações:

    1. Amazon Kendra mapeamentos de campo padrão — Selecione entre os campos de fonte de dados padrão Amazon Kendra gerados que você deseja mapear para o seu índice. Você deve adicionar os valores da coluna Banco de dados para document_id e document_body

    2. Mapeamentos de campo personalizados: para adicionar campos de fonte de dados personalizados, crie um nome de campo de índice para mapear e o tipo de dados do campo.

    3. Escolha Próximo.

  9. Na página Revisar e criar, verifique se as informações inseridas estão corretas e selecione Adicionar fonte de dados. Você também pode optar por editar as informações a partir desta página. Sua fonte de dados aparecerá na página Fontes de dados depois que a fonte de dados for adicionada com sucesso.

API

Para se conectar Amazon Kendra a um banco de dados

Você deve especificar o seguinte na DatabaseConfigurationAPI:

  • ColumnConfiguration—Informações sobre onde o índice deve obter as informações do documento do banco de dados. Para obter mais detalhes, consulte ColumnConfiguration. Você deve especificar os campos DocumentDataColumnName (corpo do documento ou texto principal), DocumentIdColumnName e ChangeDetectingColumn (por exemplo, última coluna atualizada). A coluna mapeada para o campo DocumentIdColumnName deve ser uma coluna inteira. O exemplo a seguir mostra uma configuração de colunas simples para uma fonte de dados de banco de dados:

    "ColumnConfiguration": { "ChangeDetectingColumns": [ "LastUpdateDate", "LastUpdateTime" ], "DocumentDataColumnName": "TextColumn", "DocumentIdColumnName": "IdentifierColumn", "DocoumentTitleColumnName": "TitleColumn", "FieldMappings": [ { "DataSourceFieldName": "AbstractColumn", "IndexFieldName": "Abstract" } ] }
  • ConnectionConfiguration— Informações de configuração necessárias para se conectar a um banco de dados. Para obter mais detalhes, consulte ConnectionConfiguration.

  • DatabaseEngineType— O tipo de mecanismo de banco de dados que executa o banco de dados. O DatabaseHost campo para ConnectionConfiguration deve ser o endpoint da instância Amazon Relational Database Service (Amazon RDS) do banco de dados. Não use o endpoint do cluster.

  • Nome de recurso secreto da Amazon (ARN) — Forneça o nome de recurso da Amazon (ARN) de um Secrets Manager segredo que contenha as credenciais de autenticação da sua conta de banco de dados. A senha deve conter uma estrutura JSON com as seguintes chaves:

    { "username": "user name", "password": "password" }

    O exemplo a seguir mostra uma configuração de banco de dados, incluindo o ARN secreto.

    "DatabaseConfiguration": { "ConnectionConfiguration": { "DatabaseHost": "host.subdomain.domain.tld", "DatabaseName": "DocumentDatabase", "DatabasePort": 3306, "SecretArn": "arn:aws:secretmanager:region:account ID:secret/secret name", "TableName": "DocumentTable" } }
    nota

    Recomendamos que você atualize ou alterne regularmente as credenciais e as senhas. Forneça somente o nível de acesso necessário para sua própria segurança. Não recomendamos que você reutilize credenciais e senhas nas fontes de dados e nas versões 1.0 e 2.0 do conector (quando for aplicável).

  • IAM role — Especifique RoleArn quando você chama CreateDataSource para fornecer uma IAM função com permissões para acessar seu Secrets Manager segredo e chamar as APIs públicas necessárias para o conector do banco de dados e. Amazon Kendra Para obter mais informações, consulte Funções do IAM para as fontes de dados do banco de dados.

Você também pode adicionar os seguintes recursos opcionais:

  • Nuvem privada virtual (VPC): especifique VpcConfiguration como parte da configuração da fonte de dados. Consulte Configuração do Amazon Kendra para usar uma VPC.

    nota

    Você deve usar somente uma sub-rede privada. Se sua instância do RDS estiver em uma sub-rede pública na VPC, crie uma sub-rede privada que tenha acesso de saída a um gateway NAT na sub-rede pública. As sub-redes fornecidas na configuração da VPC devem estar nas regiões Oeste dos EUA (Oregon), Leste dos EUA (N. da Virgínia), Leste dos EUA (N. da Virgínia) e UE (Irlanda).

  • Mapeamentos de campo: escolha mapear os campos de fonte de dados do para os campos de índice do Amazon Kendra . Para obter mais informações, consulte Mapear campos de fonte de dados.

    nota

    O campo do corpo do documento ou o corpo do documento equivalente para seus documentos é obrigatório Amazon Kendra para pesquisar seus documentos. Você deve mapear o nome do campo do corpo do documento na fonte de dados para o nome do campo de índice_document_body. Todos os demais campos são opcionais.

  • Filtragem de contexto do usuário e controle de acesso —Amazon Kendra rastreia a lista de controle de acesso (ACL) de seus documentos, se você tiver uma ACL para seus documentos. As informações da ACL são usadas para filtrar os resultados da pesquisa com base no acesso do usuário ou do grupo aos documentos. Para obter mais informações, consulte Filtrar o contexto do usuário.