Solucionar problemas de origens de dados - Amazon Kendra

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Solucionar problemas de origens de dados

Esta seção pode ajudá-lo a resolver problemas comuns ao configurar e usar conectores de fonte Amazon Kendra de dados.

Meus documentos não foram indexados

Ao sincronizar seu Amazon Kendra índice com uma fonte de dados, você pode ter problemas que impedem que os documentos sejam indexados. A indexação é um processo em duas etapas. Primeiro, a fonte de dados é verificada em busca de documentos novos e atualizados para indexar e para encontrar documentos a serem removidos do índice. Segundo, no nível do documento, cada documento é acessado e indexado.

Um erro pode ocorrer em qualquer uma dessas etapas. Os erros no nível da fonte de dados são relatados no console na seção Histórico de execução da sincronização da página de detalhes da fonte de dados. O status da tarefa de sincronização pode ser Bem-sucedido, Incompleto ou Falha. Visualize também o número de documentos indexados e excluídos durante o trabalho. Se o status for Falha, uma mensagem será exibida na coluna Detalhes.

Os erros no nível do documento são relatados em Amazon CloudWatch Logs. Você pode ver os erros usando o CloudWatch console.

Para gerar um relatório de status de sincronização de documentos, consulte Quero gerar um relatório de status de sincronização para meus documentos.

Meu trabalho de sincronização falhou

Normalmente, um trabalho de sincronização falha quando há um erro de configuração no índice ou na fonte de dados. No console, encontre a mensagem de erro na seção Histórico de execução da sincronização da página de detalhes da fonte de dados, na coluna Detalhes. Os erros no nível do documento são relatados no Amazon CloudWatch Logs. A mensagem de erro fornece informações sobre o que deu errado. O problema geralmente é que o índice ou a fonte de dados não tem as IAM permissões adequadas. A mensagem de erro descreve as permissões ausentes. Aqui estão algumas das mensagens de erro que você poderá receber:

Failed to create log group for job. Please make sure that the IAM role provided has sufficient permissions.

Se sua função de índice não tiver permissão de uso CloudWatch, a fonte de dados não poderá criar um CloudWatch registro. Se você receber esse erro, deverá adicionar CloudWatch permissões à função de índice.

Failed to access Amazon S3 file prefix (bucket name) while trying to crawl your metadata files. Please make sure the IAM role (ARN) provided has sufficient permissions.

Ao usar uma fonte de Amazon S3 dados, você Amazon Kendra deve ter permissão para acessar o bucket que contém os documentos. Você precisa adicionar permissão Amazon Kendra para ler o bucket à IAM função de fonte de dados.

The provided IAM role (ARN) could not be assumed. Please make sure Amazon Kendra is a trusted entity that is allowed to assume the role.

Amazon Kendra precisa de permissão para assumir as IAM funções de índice e fonte de dados. Adicione uma política de confiança às funções com permissão para a ação de sts:AssumeRole.

Para as IAM políticas que Amazon Kendra precisam indexar uma fonte de dados, consulte IAM funções.

Para gerar um relatório de status de sincronização de documentos, consulte Quero gerar um relatório de status de sincronização para meus documentos.

Meu trabalho de sincronização está incompleto

Os trabalhos geralmente ficam incompletos quando concluem o processo no nível da fonte de dados, mas apresentam alguns erros durante o processo no nível do documento. Quando um trabalho está incompleto, alguns dos documentos podem não ter sido indexados com êxito. Para uma fonte de dados do Amazon S3 , um trabalho incompleto geralmente é causado por:

  • Os metadados de um ou mais documentos eram inválidos.

  • Quando os documentos são enviados para indexação, mas pelo menos um documento não foi enviado.

  • Quando os documentos são enviados para exclusão do índice, mas pelo menos um documento não foi enviado.

Para solucionar um trabalho de sincronização incompleto, consulte primeiro seus CloudWatch registros.

  1. Na coluna de detalhes, escolha Exibir detalhes em CloudWatch.

  2. Examine as mensagens de erro para visualizar o que causou a falha do documento.

Para gerar um relatório de status de sincronização de documentos, consulte Quero gerar um relatório de status de sincronização para meus documentos.

Meu trabalho de sincronização foi bem-sucedido, mas não há documentos indexados

Ocasionalmente, a execução de uma tarefa de sincronização de índice será marcada como bem-sucedida, mas não há documentos novos ou atualizados indexados conforme o esperado. Os possíveis motivos incluem:

  • Verifique a CloudWatch DocumentsSubmittedForIndexingFailed métrica para ver se algum documento falhou na sincronização. Verifique seus CloudWatch registros para obter detalhes.

  • Para uma fonte Amazon S3 de dados, você pode ter fornecido Amazon Kendra o nome ou prefixo incorreto do bucket. Verifique se o bucket que Amazon Kendra está usando é aquele que contém os documentos a serem indexados.

  • Ao reindexar um documento que não foi indexado em um trabalho anterior, o Amazon Kendra não o indexará, a menos que você tenha alterado o documento ou o arquivo de metadados associado.

Para gerar um relatório de status de sincronização de documentos, consulte Quero gerar um relatório de status de sincronização para meus documentos.

Estou enfrentando problemas de formato de arquivo ao sincronizar minha fonte de dados

Se tiver problemas de formato de arquivo ao adicionar arquivos à sua fonte de dados ou sincronizar sua fonte de dados, verifique se os tipos de documentos têm suporte pelo Amazon Kendra . Para obter uma lista dos tipos de documentos suportados pelo, Amazon Kendra consulte Tipos ou formatos de documentos.

Se estiver usando a API de BatchPutDocument com arquivos de texto simples, especifique o PLAIN_TEXT como tipo de conteúdo.

Quero gerar um relatório de status de sincronização para meus documentos

Quando você sincroniza seu conector de fonte de Amazon Kendra dados, Amazon Kendra pode gerar relatórios de status de sincronização para cada documento em sua fonte de dados e copiá-los para um Amazon S3 bucket. Durante esse processo, seus dados são criptografados usando chaves do AWS KMS e só podem ser visualizados por você. O status do documento relatado pode ser um dos seguintes: Falha, Concluído ou Bem-sucedido com erros.

Antes de gerar relatórios de status de sincronização, você deverá fazer o seguinte:

  • Adicione o seguinte principal Amazon Kendra de serviço à sua política de Amazon S3 acesso

    { “Version”: “2012-10-17", “Statement”: [ { “Sid”: “KendraS3Access”, “Effect”: “Allow”, “Principal”: { “Service”: “kendra.amazonaws.com” }, “Action”: “s3:PutObject”, “Resource”: “arn:aws:s3:::your-manifest-bucket-name/*” } ] }
  • Crie um Amazon S3 bucket com permissões de acesso para Amazon Kendra

No console, para gerar um relatório de status de sincronização, opte por ativar a opção Geração do histórico de sincronização na página Detalhes da fonte de dados. Em seguida, insira a localização do Amazon S3 bucket e escolha entre as opções de configuração disponíveis. Os relatórios serão gerados na próxima sincronização depois que você ativar a geração de relatórios.

Se você excluir o Amazon S3 bucket, perderá seus dados de log e precisará configurar um novo bucket para armazenar novos relatórios de sincronização.

No momento, a geração do status de relatórios de sincronização é compatível somente com o conector do Amazon S3.

Quanto tempo demora a sincronização de uma fonte de dados?

Se não houver atualizações nos documentos, o tempo de sincronização de um Amazon Kendra índice aumenta em proporção linear ao número de documentos. Por exemplo, 1.000 documentos sem nenhuma atualização levariam cerca de cinco minutos para serem sincronizados e 2.000 documentos sem nenhuma atualização levariam cerca de 10 minutos. Se houver alguma atualização nos documentos, o tempo de sincronização aumentará com base no número de documentos atualizados.

Qual é a cobrança pela sincronização de uma fonte de dados?

Quando você sincroniza seu índice, leva dois minutos para aquecer e ativar Amazon EC2 para estabelecer as conexões necessárias. Você não é cobrado durante esse processo. Seu medidor de uso começa somente após o início da tarefa de sincronização. Para obter mais informações sobre Amazon Kendra preços, consulte Amazon Kendra preços.

Estou recebendo um erro Amazon EC2 de autorização

Se ocorrer um erro de operação Amazon EC2 não autorizada durante a sincronização de uma fonte de dados de nuvem privada virtual (VPC), é provável que sua função de IAM VPC não tenha as permissões necessárias. Verifique se a IAM função que você usa para sua fonte de dados tem as permissões anexadas. Para obter mais informações, consulte IAM Função de nuvem privada virtual.

Seu Amazon Kendra índice só pode acessar arquivos que uma fonte de Amazon S3 dados concede permissão para acessar. Por exemplo, Amazon Kendra não é possível modificar as Amazon S3 permissões que determinam se um objeto deve ser público ou criptografado. Amazon Kendra também não tem as permissões padrão para criar ou retornar um link assinado para Amazon S3 objetos. Se você quiser ativar a vinculação assinada para Amazon S3 objetos em um Amazon Kendra índice, você tem duas opções:

  • Assine os resultados da consulta de índice com o objeto URI de origem antes de retornar o resultado à página de pesquisa. Para ver um step-by-step passo a passo desse processo, consulte Compartilhamento de objetos usando URLs pré-assinados.

  • Você pode substituir o uri da fonte de metadados do Amazon S3 objeto e disponibilizar seu serviço por meio de uma rede de distribuição de CloudFront conteúdo (CDN) conectada a um bucket. Amazon S3 Ou você pode usar um endpoint de API Gateway proxy que retorna uma URL pré-assinada e redireciona para ela.

Estou recebendo uma mensagem de erro AccessDenied Ao usar o arquivo de certificado SSL

Se você estiver recebendo um erro de acesso negado ao usar um certificado SSL com sua fonte de dados, certifique-se de que sua IAM função tenha permissão para acessar o arquivo do certificado SSL no local especificado. Se o certificado for criptografado com uma AWS KMS chave, sua IAM função também deverá ter permissão para descriptografar usando a chave. AWS KMS Para obter mais informações, consulte Autenticação e controle de acesso para o AWS KMS.

Estou recebendo um erro de autorização ao usar uma fonte SharePoint de dados

Se você estiver recebendo um erro de autorização ao sincronizar seu índice com uma fonte de SharePoint dados, confirme se você tem uma função de administrador do site atribuída a você em SharePoint.

Meu índice não rastreia documentos da minha fonte de dados do Confluence

Se seu Amazon Kendra índice não estiver rastreando documentos da sua fonte de dados do Confluence durante o processo de sincronização, confirme se você faz parte dos grupos de administradores no Confluence.