Adición de documentos directamente a un índice - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Adición de documentos directamente a un índice

Puede agregar documentos directamente a un índice mediante la API BatchPutDocument. No puede añadir documentos directamente con la consola. Cuando se utiliza la consola, se utiliza un origen de datos para agregar documentos.

Solo puede añadir los tipos de documentos siguientes con la API BatchPutDocuments.

  • Texto no cifrado

  • HTML

  • PDF

  • Microsoft PowerPoint

  • Microsoft Word

Los documentos se pueden agregar desde un bucket de S3 o suministrarse como datos binarios.

La adición de documentos a un índice es asincrónica. Después de llamar a la API BatchPutDocument, utilice la API BatchGetDocumentStatus para supervisar el progreso de la indexación de los documentos. Cuando se lama a la API BatchGetDocumentStatus con una lista de identificadores de documento, devuelve el estado del documento. Cuando el estado del documento sea INDEXED o FAILED, se habrá completado el procesamiento del documento. Cuando el estado sea FAILED, la API BatchGetDocumentStatus devolverá el motivo por el que el documento no se haya podido indexar.

Si desea modificar los metadatos o atributos del documento y el contenido durante el proceso de ingesta de documentos, consulte Custom Document Enrichment de Amazon Kendra.

Si desea utilizar un origen de datos personalizado, cada documento que envíe mediante la API BatchPutDocument requiere un ID de origen de datos y un ID de ejecución como atributos. Para obtener más información, consulte Atributos obligatorios para orígenes de datos personalizados.

Tenga en cuenta que cada ID de documento debe ser único por índice. No se puede crear un origen de datos para indexar los documentos con sus ID exclusivos y, a continuación, utilizar la API BatchPutDocument para indexar los mismos documentos o viceversa. No se puede crear un origen de datos para indexar los documentos con sus ID exclusivos y, a continuación, utilizar la API BatchPutDocument para indexar los mismos documentos o viceversa.

En los ejemplos siguientes se muestra cómo añadir documentos directamente a un índice.