Risoluzione dei problemi relativi alle origini dati - Amazon Kendra

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Risoluzione dei problemi relativi alle origini dati

Questa sezione può aiutarti a risolvere i problemi più comuni relativi alla configurazione e all'utilizzo Amazon Kendra dei connettori di origine dati.

I miei documenti non sono stati indicizzati

Quando sincronizzi l' Amazon Kendra indice con un'origine dati, potresti riscontrare problemi che impediscono l'indicizzazione dei documenti. L'indicizzazione è un processo in due fasi. Innanzitutto, viene verificata la presenza di documenti nuovi e aggiornati da indicizzare e per individuare i documenti da rimuovere dall'indice. In secondo luogo, a livello di documento, ogni documento è accessibile e indicizzato.

In uno di questi passaggi può verificarsi un errore. Gli errori a livello di origine dati vengono segnalati nella console nella sezione Cronologia delle esecuzioni di sincronizzazione della pagina dei dettagli dell'origine dati. Lo stato del processo di sincronizzazione può essere Riuscito, Incompleto o Non riuscito. È inoltre possibile visualizzare il numero di documenti indicizzati ed eliminati durante il processo. Se lo stato è Fallito, viene visualizzato un messaggio nella colonna Dettagli.

Gli errori a livello di documento vengono segnalati in Amazon CloudWatch Logs. È possibile visualizzare gli errori utilizzando la CloudWatch console.

Per generare un rapporto sullo stato della sincronizzazione dei documenti, vedi Desidero generare un rapporto sullo stato della sincronizzazione per i miei documenti.

Il mio processo di sincronizzazione non è riuscito

Un processo di sincronizzazione in genere fallisce quando si verifica un errore di configurazione nell'indice o nell'origine dati. Nella console, puoi trovare il messaggio di errore nella sezione Cronologia delle esecuzioni di sincronizzazione della pagina dei dettagli dell'origine dati, nella colonna Dettagli. Gli errori a livello di documento sono segnalati in Amazon CloudWatch Logs. Il messaggio di errore fornisce informazioni su cosa è andato storto. Il problema è in genere che l'indice o l'origine dati non dispongono delle IAM autorizzazioni appropriate. Il messaggio di errore descrive le autorizzazioni mancanti. Ecco alcuni dei messaggi di errore che puoi ricevere:

Failed to create log group for job. Please make sure that the IAM role provided has sufficient permissions.

Se il ruolo di indice non dispone dell'autorizzazione all'uso CloudWatch, l'origine dati non sarà in grado di creare un CloudWatch registro. Se viene visualizzato questo errore, è necessario aggiungere CloudWatch le autorizzazioni al ruolo di indice.

Failed to access Amazon S3 file prefix (bucket name) while trying to crawl your metadata files. Please make sure the IAM role (ARN) provided has sufficient permissions.

Quando si utilizza una fonte di Amazon S3 dati, è Amazon Kendra necessario disporre dell'autorizzazione per accedere al bucket che contiene i documenti. È necessario aggiungere l'autorizzazione Amazon Kendra per leggere il bucket al ruolo di origine IAM dati.

The provided IAM role (ARN) could not be assumed. Please make sure Amazon Kendra is a trusted entity that is allowed to assume the role.

Amazon Kendra necessita dell'autorizzazione per assumere i IAM ruoli di indice e origine dati. È necessario aggiungere una politica di attendibilità ai ruoli con autorizzazione per l'sts:AssumeRoleazione.

Per le IAM politiche che Amazon Kendra richiedono l'indicizzazione di un'origine dati, consulta IAM i ruoli.

Per generare un rapporto sullo stato della sincronizzazione dei documenti, vedi Desidero generare un rapporto sullo stato della sincronizzazione per i miei documenti.

Il mio processo di sincronizzazione è incompleto

I lavori sono generalmente incompleti quando hanno completato il processo a livello di origine dati, ma presentano qualche errore durante il processo a livello di documento. Quando un lavoro è incompleto, alcuni documenti potrebbero non essere stati indicizzati correttamente. Per un'origine Amazon S3 dati, un processo incompleto è in genere causato da:

  • I metadati per uno o più documenti non erano validi.

  • Quando i documenti vengono inviati per l'indicizzazione ma almeno un documento non è stato inviato.

  • Quando vengono inviati documenti per essere eliminati dall'indice ma almeno un documento non è stato inviato.

Per risolvere un processo di sincronizzazione incompleto, consulta innanzitutto i tuoi log. CloudWatch

  1. Dalla colonna dei dettagli, scegli Visualizza dettagli in. CloudWatch

  2. Esamina i messaggi di errore per vedere cosa ha causato il fallimento del documento.

Per generare un rapporto sullo stato della sincronizzazione dei documenti, vedi Desidero generare un rapporto sullo stato della sincronizzazione per i miei documenti.

Il mio processo di sincronizzazione è riuscito ma non ci sono documenti indicizzati

Occasionalmente, un processo di sincronizzazione dell'indice eseguito viene contrassegnato come Riuscito, ma non ci sono documenti nuovi o aggiornati indicizzati quando previsto. Le ragioni possibili sono:

  • Controlla la CloudWatch DocumentsSubmittedForIndexingFailed metrica per vedere se qualche documento non è riuscito a sincronizzarsi. Controlla i tuoi CloudWatch log per i dettagli.

  • Per una fonte di Amazon S3 dati, potresti aver fornito Amazon Kendra il nome o il prefisso del bucket errato. Assicurati che il bucket che stai utilizzando Amazon Kendra sia quello che contiene i documenti da indicizzare.

  • Quando reindicizzi un documento che non è stato indicizzato in un lavoro precedente, non lo indicizzerà a meno che tu Amazon Kendra non abbia modificato il documento o il file di metadati associato.

Per generare un rapporto sullo stato della sincronizzazione dei documenti, vedi Desidero generare un rapporto sullo stato della sincronizzazione per i miei documenti.

Sto riscontrando problemi di formato dei file durante la sincronizzazione della mia fonte di dati

Se riscontri problemi di formato dei file durante l'aggiunta di file alla fonte dati o la sincronizzazione dell'origine dati, assicurati che i tipi di documento siano Amazon Kendra supportati. Per un elenco dei tipi di documenti supportati da, Amazon Kendra consulta Tipi o formati di documenti.

Se utilizzi l'BatchPutDocumentAPI con file di testo semplice, specifica PLAIN_TEXT come tipo di contenuto.

Voglio generare un rapporto sulla cronologia delle sincronizzazioni per i miei documenti

Quando Amazon Kendra sincronizzi il connettore della sorgente dati, Amazon Kendra puoi generare report sullo stato della sincronizzazione per ogni documento nella tua fonte di dati e copiarli in un Amazon S3 bucket. Durante questo processo, i dati vengono crittografati tramite AWS KMS chiavi e possono essere visualizzati solo da te. Lo stato del documento segnalato può essere uno dei seguenti: Non riuscito, Completato o Riuscito con errori.

Prima di poter generare report sullo stato della sincronizzazione, è necessario effettuare le seguenti operazioni:

  • Aggiungi il seguente Amazon Kendra servizio principale alla tua politica di Amazon S3 accesso

    { “Version”: “2012-10-17", “Statement”: [ { “Sid”: “KendraS3Access”, “Effect”: “Allow”, “Principal”: { “Service”: “kendra.amazonaws.com” }, “Action”: “s3:PutObject”, “Resource”: “arn:aws:s3:::your-manifest-bucket-name/*” } ] }
  • Crea un Amazon S3 bucket con autorizzazioni di accesso a Amazon Kendra

Se utilizzi la console, per generare un rapporto sullo stato della sincronizzazione, scegli di attivare l'opzione di generazione della cronologia di sincronizzazione dalla pagina dei dettagli dell'origine dati. Quindi, inserisci la posizione del Amazon S3 bucket e scegli tra le opzioni di configurazione disponibili. I report verranno generati dalla sincronizzazione successiva dopo l'attivazione della funzione di generazione del rapporto.

Se elimini il Amazon S3 bucket, perderai i dati di registro e dovrai configurare un nuovo bucket per archiviare i nuovi report di sincronizzazione.

Lo stato della generazione dei report di sincronizzazione è attualmente supportato solo per il Amazon S3 connettore.

Quanto tempo richiede la sincronizzazione di una fonte di dati?

Se non ci sono aggiornamenti ai documenti, il tempo di sincronizzazione di un Amazon Kendra indice aumenta in modo lineare rispetto al numero di documenti. Ad esempio, la sincronizzazione di 1.000 documenti senza aggiornamenti richiederebbe circa cinque minuti e 2.000 documenti senza aggiornamenti circa 10 minuti. Se sono presenti aggiornamenti ai documenti, il tempo di sincronizzazione aumenterà in base al numero di documenti aggiornati.

Qual è il costo per la sincronizzazione di una fonte di dati?

Quando sincronizzi l'indice, occorrono due minuti per riscaldarsi e Amazon EC2 attivarsi per stabilire le connessioni necessarie. Non ti viene addebitato alcun costo durante questo processo. Il misuratore di utilizzo inizia solo dopo l'avvio del processo di sincronizzazione. Per ulteriori informazioni sui Amazon Kendra prezzi, consulta la pagina Amazon Kendra dei prezzi.

Ricevo un errore di Amazon EC2 autorizzazione

Se si verifica un errore di funzionamento Amazon EC2 non autorizzato durante una sincronizzazione per un'origine dati su cloud privato virtuale (VPC), è probabile che il ruolo IAM VPC non disponga delle autorizzazioni necessarie. Verifica che il IAM ruolo che utilizzi per la tua origine dati disponga delle autorizzazioni allegate. Per ulteriori informazioni, consulta IAM Ruolo nel cloud privato virtuale.

Amazon Kendra L'indice può accedere solo ai file per i quali un'origine Amazon S3 dati gli concede le autorizzazioni di accesso. Ad esempio, Amazon Kendra non è possibile modificare le Amazon S3 autorizzazioni che determinano se un oggetto deve essere pubblico o crittografato. Amazon Kendra inoltre non dispone delle autorizzazioni predefinite per creare o restituire un link firmato per gli Amazon S3 oggetti. Se desideri attivare il collegamento firmato per Amazon S3 gli oggetti in un Amazon Kendra indice, hai due opzioni:

  • È possibile utilizzare la firma dei risultati della query sull'indice con l'oggetto uri di origine prima di restituire il risultato alla pagina di ricerca. Per una descrizione step-by-step dettagliata di questo processo, consultate Condivisione di oggetti utilizzando URL predefiniti.

  • È possibile sovrascrivere l'URI della fonte dei metadati Amazon S3 dell'oggetto e rendere disponibile il servizio tramite una rete per la distribuzione di CloudFront contenuti (CDN) connessa a un bucket. Amazon S3 In alternativa, puoi utilizzare un endpoint API Gateway proxy che restituisce un URL predefinito e reindirizza ad esso.

Ricevo un messaggio di errore relativo all'AccessDenied utilizzo del file del certificato SSL

Se ricevi un errore di accesso negato quando usi un certificato SSL con la tua origine dati, assicurati che il tuo IAM ruolo disponga dell'autorizzazione per accedere al file del certificato SSL nella posizione specificata. Se il certificato è crittografato con una AWS KMS chiave, il tuo IAM ruolo dovrebbe avere anche l'autorizzazione a decrittografare utilizzando la chiave. AWS KMS Per ulteriori informazioni, consulta Autenticazione e controllo degli accessi per. AWS KMS

Ricevo un errore di autorizzazione quando utilizzo una fonte di SharePoint dati

Se ricevi un errore di autorizzazione durante la sincronizzazione dell'indice con un'origine SharePoint dati, conferma che ti è stato assegnato un ruolo di amministratore del sito in SharePoint.

Il mio indice non esegue la scansione dei documenti dalla mia fonte di dati Confluence

Se l' Amazon Kendra indice non esegue la scansione dei documenti dalla fonte dati Confluence durante il processo di sincronizzazione, conferma di far parte dei gruppi di amministratori di Confluence.