Amazon FSx (Windows) - Amazon Kendra

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Amazon FSx (Windows)

Amazon FSx (Windows) é um sistema de servidor de arquivos baseado em nuvem totalmente gerenciado que oferece recursos de armazenamento compartilhado. Se você for um usuário Amazon FSx (Windows), você pode usar Amazon Kendra para indexar sua fonte de dados Amazon FSx (Windows).

nota

Amazon Kendra agora oferece suporte a um conector atualizado Amazon FSx (Windows).

O console foi atualizado automaticamente para você. Todos os novos conectores que você criar no console usarão a arquitetura atualizada. Se você usa a API, agora deve usar o TemplateConfigurationobjeto em vez do FSxConfiguration objeto para configurar seu conector.

Os conectores configurados usando o console antigo e a arquitetura de API continuarão funcionando conforme configurados. No entanto, você não poderá editá-los ou atualizá-los. Se você quiser editar ou atualizar a configuração do conector, deverá criar um novo conector.

Recomendamos migrar o fluxo de trabalho do conector para a versão atualizada. O suporte para conectores configurados usando a arquitetura mais antiga está programado para terminar em junho de 2024.

Você pode se conectar Amazon Kendra à sua fonte de dados Amazon FSx (Windows) usando o Amazon Kendra console ou a TemplateConfigurationAPI.

Para solucionar problemas do conector da fonte de dados Amazon Kendra Amazon FSx (Windows), consulteSolucionar problemas de origens de dados.

Atributos compatíveis

Amazon Kendra Amazon FSx O conector de fonte de dados (Windows) oferece suporte aos seguintes recursos:

  • Mapeamentos de campos

  • Controle de acesso do usuário

  • Rastreamento de identidade do usuário

  • Filtros de inclusão e exclusão

  • Sincronizações de conteúdo completas e incrementais

  • Nuvem privada virtual (VPC)

Pré-requisitos

Antes de usar Amazon Kendra para indexar sua fonte de dados Amazon FSx (Windows), verifique os detalhes de seu Amazon FSx (Windows) Contas da AWS e.

Para Amazon FSx (Windows), verifique se você tem:

  • Configure Amazon FSx (Windows) com permissões de leitura e montagem.

  • Anotou o ID do seu sistema de arquivos. Você pode encontrar o ID do sistema de arquivos no painel Sistemas de arquivos no console Amazon FSx (Windows).

  • Configurou uma nuvem privada virtual usando Amazon VPC onde seu sistema de arquivos Amazon FSx (Windows) reside.

  • Anotou suas credenciais de autenticação Amazon FSx (Windows) para uma conta de Active Directory usuário. Isso inclui seu nome de usuário do Active Directory com seu nome de domínio DNS (por exemplo, user@corp.example.com) e senha.

    nota

    Use somente as credenciais necessárias para que o conector funcione. Não use credenciais privilegiadas, como administrador de domínio.

    nota

    Recomendamos que você atualize ou alterne regularmente as credenciais e as senhas. Forneça somente o nível de acesso necessário para sua própria segurança. Não recomendamos que você reutilize credenciais e senhas nas fontes de dados e nas versões 1.0 e 2.0 do conector (quando for aplicável).

  • Verificado se cada documento é exclusivo no Amazon FSx (Windows) e em outras fontes de dados que você planeja usar para o mesmo índice. Cada fonte de dados que você deseja usar para um índice não deve conter o mesmo documento em todas as fontes de dados. Os IDs de documentos são globais para um índice e devem ser exclusivos por índice.

No seu Conta da AWS, verifique se você tem:

  • Criou um Amazon Kendra índice e, se estiver usando a API, anotei o ID do índice.

  • Criou uma IAM função para sua fonte de dados e, se estiver usando a API, anotei o ARN da IAM função.

    nota

    Se você alterar o tipo de autenticação e as credenciais, deverá atualizar sua IAM função para acessar a ID AWS Secrets Manager secreta correta.

  • Armazenou suas credenciais de autenticação Amazon FSx (Windows) em um AWS Secrets Manager segredo e, se estiver usando a API, anotou o ARN do segredo.

    nota

    Recomendamos que você atualize ou alterne regularmente as credenciais e as senhas. Forneça somente o nível de acesso necessário para sua própria segurança. Não recomendamos que você reutilize credenciais e senhas nas fontes de dados e nas versões 1.0 e 2.0 do conector (quando for aplicável).

Se você não tiver uma IAM função ou segredo existente, poderá usar o console para criar uma nova IAM função e um novo Secrets Manager segredo ao conectar sua fonte de dados Amazon FSx (Windows) Amazon Kendra a. Se você estiver usando a API, deverá fornecer o ARN de uma IAM função e Secrets Manager segredo existentes e um ID de índice.

Instruções de conexão

Para se conectar Amazon Kendra à sua fonte de dados Amazon FSx (Windows), você deve fornecer os detalhes necessários da sua fonte de dados Amazon FSx (Windows) para que Amazon Kendra possa acessar seus dados. Se você ainda não configurou Amazon FSx (Windows) para Amazon Kendra, consultePré-requisitos.

Console

Para se conectar Amazon Kendra ao seu sistema de arquivos Amazon FSx (Windows)

  1. Faça login no AWS Management Console e abra o Amazon Kendra console.

  2. No painel de navegação esquerdo, escolha Índices e, em seguida, escolha o índice que deseja usar na lista de índices.

    nota

    Você pode escolher definir ou editar as configurações de Controle de acesso do usuário em Configurações do índice.

  3. Na página Introdução, escolha Adicionar fonte de dados.

  4. Na página Adicionar fonte de dados, escolha conector Amazon FSx (Windows) e, em seguida, escolha Adicionar conector. Se estiver usando a versão 2 (se aplicável), escolha o conector Amazon FSx (Windows) com a tag “V2.0".

  5. Na página Especar detalhes da fonte de dados, insira as seguintes informações:

    1. Em Nome e descrição, em Nome da fonte de dados: insira um nome para a fonte de dados. Você pode incluir hífens, mas não espaços.

    2. (Opcional) Descrição: insira uma descrição opcional para a fonte de dados.

    3. Em Idioma padrão — Escolha um idioma para filtrar seus documentos para o índice. A menos que você especifique o contrário, o idioma padrão é o inglês. O idioma especificado nos metadados do documento substitui o idioma selecionado.

    4. Em Tags, em Adicionar nova tag — Inclua tags opcionais para pesquisar e filtrar seus recursos ou monitorar seus AWS custos.

    5. Escolha Próximo.

  6. Na página Definir seção e segurança, insira as informações a seguir:

    1. Amazon FSx ID do sistema de arquivos (Windows) — Selecione na lista suspensa sua ID do sistema de arquivos existente, obtida Amazon FSx em (Windows). Ou crie um sistema de arquivos Amazon FSx (Windows). Você pode encontrar o ID do sistema de arquivos no painel Sistemas de arquivos no console Amazon FSx (Windows).

    2. Autorização — Ative ou desative as informações da lista de controle de acesso (ACL) para seus documentos, se você tiver uma ACL e quiser usá-la para controle de acesso. A ACL especifica quais documentos os usuários e grupos podem acessar. As informações da ACL são usadas para filtrar os resultados da pesquisa com base no acesso do usuário ou do grupo aos documentos. Para obter mais informações, consulte Filtrar o contexto do usuário.

    3. Autenticação — escolha um AWS Secrets Manager segredo existente ou crie um novo segredo para armazenar suas credenciais do sistema de arquivos. Se optar por criar uma nova senha, uma janela secreta do AWS Secrets Manager será aberta.

      Forneça um segredo que armazene suas credenciais de autenticação do seu nome de usuário e senha. O nome de usuário deve incluir seu nome de domínio DNS. Por exemplo, user@corp.example.com.

      Salve e adicione seu segredo.

    4. Virtual Private Cloud (VPC) — Você deve selecionar um Amazon VPC local onde seu Amazon FSx (Windows) reside. Você inclui a sub-rede e os grupos de segurança da VPC. Consulte Configurando um Amazon VPC.

    5. IAM função — Escolha uma IAM função existente ou crie uma nova IAM função para acessar as credenciais do repositório e indexar o conteúdo.

      nota

      IAM as funções usadas para índices não podem ser usadas para fontes de dados. Se você não tiver certeza se uma função existente é usada para um índice ou perguntas frequentes, escolha Criar uma nova função para evitar erros.

    6. Escolha Próximo.

  7. Na página Configurar configurações de sincronização, insira as seguintes informações:

    1. Escopo de sincronização, padrões Regex — adicione padrões de expressão regular para incluir ou excluir determinados arquivos.

    2. Modo de sincronização: escolha como você deseja atualizar o índice quando o conteúdo da fonte de dados for alterado. Quando você sincroniza sua fonte de dados Amazon Kendra pela primeira vez, todo o conteúdo é rastreado e indexado por padrão. Você deve executar uma sincronização completa dos seus dados se a sincronização inicial falhar, mesmo que você não escolha a sincronização completa como opção de modo de sincronização.

      • Sincronização completa: indexe todo o conteúdo de forma atualizada, substituindo o conteúdo existente sempre que sua fonte de dados for sincronizada com seu índice.

      • Sincronização nova, modificada e excluída: indexe somente conteúdo novo, modificado e excluído sempre que sua fonte de dados for sincronizada com seu índice. Amazon Kendra pode usar o mecanismo da sua fonte de dados para rastrear alterações no conteúdo e indexar o conteúdo que foi alterado desde a última sincronização.

    3. Cronograma de execução da sincronização — em Frequência, escolha com que frequência sincronizar o conteúdo da fonte de dados e atualize seu índice.

    4. Escolha Próximo.

  8. Na página Definir mapeamentos de campo, insira as seguintes informações:

    1. Selecione entre os campos padrão Amazon Kendra gerados dos seus arquivos que você deseja mapear para o seu índice. Para adicionar campos de fonte de dados personalizados, crie um nome de campo de índice para mapear e o tipo de dados do campo.

    2. Escolha Próximo.

  9. Na página Revisar e criar, verifique se as informações inseridas estão corretas e selecione Adicionar fonte de dados. Você também pode optar por editar as informações a partir desta página. Sua fonte de dados aparecerá na página Fontes de dados depois que a fonte de dados for adicionada com sucesso.

API

Para se conectar Amazon Kendra ao seu sistema de arquivos Amazon FSx (Windows)

Você deve especificar um JSON do esquema da fonte de dados usando a API TemplateConfiguration. Você deve fornecer as seguintes informações:

  • Fonte de dados — especifique o tipo de fonte de dados como FSX quando você usa o esquema TemplateConfigurationJSON. Além disso, especifique a fonte de dados como TEMPLATE quando você chama a CreateDataSourceAPI.

  • ID do sistema de arquivos — O identificador do sistema de arquivos Amazon FSx (Windows). Você pode encontrar o ID do sistema de arquivos no painel Sistemas de arquivos no console Amazon FSx (Windows).

  • Tipo de sistema de arquivos: especifique o tipo de sistema de arquivos como WINDOWS.

  • Nuvem privada virtual (VPC): especifique a VpcConfiguration quando ao chamar CreateDataSource. Para ter mais informações, consulte Configuração Amazon Kendra para usar um Amazon VPC.

    nota

    Você deve selecionar um Amazon VPC local onde seu Amazon FSx (Windows) resida. Você inclui a sub-rede e os grupos de segurança da VPC.

  • Modo de sincronização — especifique como Amazon Kendra você deve atualizar seu índice quando o conteúdo da fonte de dados for alterado. Quando você sincroniza sua fonte de dados Amazon Kendra pela primeira vez, todo o conteúdo é rastreado e indexado por padrão. Você deve executar uma sincronização completa dos seus dados se a sincronização inicial falhar, mesmo que você não escolha a sincronização completa como opção de modo de sincronização. Escolha uma das seguintes opções:

    • FORCED_FULL_CRAWLpara indexar todo o conteúdo de forma atualizada, substituindo o conteúdo existente sempre que sua fonte de dados é sincronizada com seu índice.

    • FULL_CRAWLpara indexar somente conteúdo novo, modificado e excluído sempre que sua fonte de dados for sincronizada com seu índice. Amazon Kendra pode usar o mecanismo da sua fonte de dados para rastrear alterações no conteúdo e indexar o conteúdo que foi alterado desde a última sincronização.

  • Rastreador de identidade — especifique se deseja ativar o rastreador Amazon Kendra de identidade. O rastreador de identidade usa as informações da lista de controle de acesso (ACL) dos seus documentos para filtrar os resultados da pesquisa com base no acesso do usuário ou do grupo aos documentos. Se você tiver uma ACL para seus documentos e optar por usá-la, também poderá optar por ativar o rastreador de identidade para configurar a filtragem de contexto Amazon Kendra do usuário dos resultados da pesquisa. Caso contrário, se o rastreador de identidade estiver desativado, todos os documentos poderão ser pesquisados publicamente. Se você quiser usar o controle de acesso para seus documentos e o rastreador de identidade estiver desativado, você também pode usar a PutPrincipalMappingAPI para carregar informações de acesso de usuários e grupos para filtragem de contexto do usuário.

  • Nome de recurso secreto da Amazon (ARN) — Forneça o nome de recurso da Amazon (ARN) de um Secrets Manager segredo que contenha as credenciais de autenticação da sua conta (Windows). Amazon FSx A senha deve conter uma estrutura JSON com as seguintes chaves:

    { "username": "user@corp.example.com", "password": "password" }
  • IAM role — Especifique RoleArn quando você chama CreateDataSource para fornecer uma IAM função com permissões para acessar seu Secrets Manager segredo e chamar as APIs públicas necessárias para o conector Amazon FSx (Windows) e. Amazon Kendra Para obter mais informações, consulte IAM funções para fontes de dados Amazon FSx (Windows).

Você também pode adicionar os seguintes recursos opcionais:

  • Filtros de inclusão e exclusão: especifique se deseja incluir ou excluir determinadas arquivos.

    nota

    A maioria das fontes de dados usa padrões de expressão regular, que são padrões de inclusão ou exclusão chamados de filtros. Se você especificar um filtro de inclusão, somente o conteúdo que corresponda ao filtro de inclusão será indexado. Qualquer documento que não corresponda ao filtro de inclusão não é indexado. Se especificar um filtro de inclusão e exclusão, os documentos que corresponderem ao filtro de exclusão não serão indexados, mesmo que correspondam ao filtro de inclusão.

  • Lista de controle de acesso (ACL) — Especifique se deseja rastrear as informações da ACL para seus documentos, se você tiver uma ACL e quiser usá-la para controle de acesso. A ACL especifica quais documentos os usuários e grupos podem acessar. As informações da ACL são usadas para filtrar os resultados da pesquisa com base no acesso do usuário ou do grupo aos documentos. Para obter mais informações, consulte Filtrar o contexto do usuário.

    nota

    Para testar a filtragem de contexto de usuário em um usuário, você deve incluir o nome de domínio DNS como parte do nome de usuário ao realizar a consulta. Você deve ter permissões administrativas do domínio do Active Directory. Você também pode testar a filtragem de contexto do usuário no nome de um grupo.

  • Mapeamentos de campo — Escolha mapear seus campos de fonte de dados Amazon FSx (Windows) para seus Amazon Kendra campos de índice. Para obter mais informações, consulte Mapear campos de fonte de dados.

    nota

    O campo do corpo do documento ou o corpo do documento equivalente para seus documentos é obrigatório Amazon Kendra para pesquisar seus documentos. Você deve mapear o nome do campo do corpo do documento na fonte de dados para o nome do campo de índice_document_body. Todos os demais campos são opcionais.

Para obter uma lista de outras chaves JSON importantes a serem configuradas, consulte Esquema de modelo Amazon FSx (Windows).

Saiba mais

Para saber mais sobre a integração Amazon Kendra com sua fonte de dados Amazon FSx (Windows), consulte: