Supervisión de Amazon Kendra con Amazon CloudWatch Registros - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Supervisión de Amazon Kendra con Amazon CloudWatch Registros

Amazon Kendra utiliza Amazon CloudWatch Registros para obtener información sobre el funcionamiento de las fuentes de datos. Amazon Kendra registra los detalles del proceso de los documentos que se indexan. Registra los errores de la fuente de datos que se producen mientras se indexan los documentos. Usas CloudWatch Registros para supervisar, almacenar y acceder a los archivos de registro.

CloudWatch Logs almacena los eventos de registro en un flujo de registros que forma parte de un grupo de registros. Amazon Kendra utiliza estas funciones de la siguiente manera:

  • Grupos de registros: Amazon Kendra almacena todas las secuencias de registro en un solo grupo de registros para cada índice. Amazon Kendra crea el grupo de registros cuando se crea el índice. El identificador del grupo de registros siempre comienza por «aws/kendra/».

  • Secuencia de registros: crea un nuevo flujo de registro de origen de datos en el grupo de registros para cada trabajo de sincronización de índices que ejecute. También crea un nuevo flujo de registro de documentos cuando un flujo alcanza aproximadamente 500 entradas.

  • Entradas de registro: Amazon Kendra crea una entrada de registro en el flujo de registros a medida que indexa documentos. Cada entrada proporciona información sobre el procesamiento del documento o cualquier error que se produzca.

Para obtener más información acerca del uso CloudWatch Registros, consulteQué es Amazon Cloud Watch Logsen laGuía del usuario de Amazon Cloud Watch Logs.

Amazon Kendra crea dos tipos de flujos de registro:

Secuencias de registro de fuentes de datos

Los flujos de registro de fuentes de datos publican entradas sobre los trabajos de sincronización de índices. Cada trabajo de sincronización crea un nuevo flujo de registro que utiliza para publicar entradas. El nombre del flujo de registro es:

data source id/YYYY-MM-DD-HH/data source sync job ID

Se crea un nuevo flujo de registro para cada trabajo de sincronización ejecutado.

Hay tres tipos de mensajes de registro publicados en un flujo de registro de origen de datos:

  • Mensaje de registro de un documento que no se ha podido enviar para indexar. A continuación, se muestra un ejemplo de este mensaje de un documento de un origen de datos de S3:

    { "DocumentId": "document ID", "S3Path": "s3://bucket/prefix/object", "Message": "Failed to ingest document via BatchPutDocument.", "ErrorCode": "InvalidRequest", "ErrorMessage": "No document metadata configuration found for document attribute key city." }
  • Mensaje de registro de un documento que no se ha podido enviar para su eliminación. A continuación se muestra un ejemplo de este mensaje:

    { "DocumentId": "document ID", "Message": "Failed to delete document via BatchDeleteDocument.", "ErrorCode": "InvalidRequest", "ErrorMessage": "Document can't be deleted because it doesn't exist." }
  • Mensaje de registro cuando se encuentra un archivo de metadatos no válido para un documento de un depósito de Amazon S3. A continuación se muestra un ejemplo de este mensaje.

    { "Message": "Found invalid metadata file bucket/prefix/filename.extension.metadata.json." }
  • Para SharePoint y conectores de bases de datos, Amazon Kendra solo escribe mensajes en el flujo de registro si un documento no se puede indexar. A continuación, se muestra un ejemplo del mensaje de error que registra Amazon Kendra.

    { "DocumentID": "document ID", "IndexID": "index ID", "SourceURI": "", "CrawlStatus": "FAILED", "ErrorCode": "403", "ErrorMessage": "Access Denied", "DataSourceErrorCode": "403" }

Flujos de registro de documentos

Amazon Kendra registra información sobre el procesamiento de documentos mientras se están indexando. Registra un conjunto de mensajes para documentos almacenados en un origen de datos de Amazon S3. Registra los errores solo de los documentos almacenados en Microsoft SharePoint o un origen de datos de base de datos.

Si los documentos se han agregado al índice mediante laBatchPutDocument, el flujo de registro se denomina de la siguiente manera:

YYYY-MM-DD-HH/UUID

Si los documentos se agregaron al índice mediante un origen de datos, el flujo de registro se denomina de la siguiente manera:

dataSourceId/YYYY-MM-DD-HH/UUID

Cada secuencia de registro contiene hasta 500 mensajes.

Si falla la indexación de un documento, este mensaje se envía al flujo de registro:

{ "DocumentId": "document ID", "IndexName": "index name", "IndexId": "index ID" "SourceURI": "source URI" "IndexingStatus": "DocumentFailedToIndex", "ErrorCode": "400 | 500", "ErrorMessage": "message" }