Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Adición de documentos directamente a un índice mediante la carga por lotes
Puede agregar documentos directamente a un índice mediante la API BatchPutDocument. No puede añadir documentos directamente con la consola. Si utiliza la consola, se conecta a un origen de datos para agregar documentos al índice. Los documentos se pueden agregar desde un bucket de S3 o suministrarse como datos binarios. Para obtener una lista de los tipos de documentos compatibles, Amazon Kendra consulte Tipos de documentos.
La adición de documentos a un índice mediante BatchPutDocument
es asincrónica. Después de llamar a la API BatchPutDocument
, utilice la API BatchGetDocumentStatus para supervisar el progreso de la indexación de los documentos. Cuando llamas a la BatchGetDocumentStatus
API con una lista de documentos IDs, devuelve el estado del documento. Cuando el estado del documento sea INDEXED
o FAILED
, se habrá completado el procesamiento del documento. Cuando el estado sea FAILED
, la API BatchGetDocumentStatus
devolverá el motivo por el que el documento no se haya podido indexar.
Si desea modificar los campos de metadatos o atributos del contenido y el documento durante el proceso de ingesta de documentos, consulte Enriquecimiento de documentos personalizados de Amazon Kendra. Si desea utilizar un origen de datos personalizado, cada documento que envíe mediante la API BatchPutDocument
requiere un ID de origen de datos y un ID de ejecución como atributos o campos. Para obtener más información, consulte Atributos obligatorios para orígenes de datos personalizados.
nota
Cada identificador de documento debe ser único por índice. No puede crear una fuente de datos para indexar los documentos con sus características únicas IDs y, a continuación, utilizar la BatchPutDocument
API para indexar los mismos documentos o viceversa. No se puede crear un origen de datos para indexar los documentos con sus ID exclusivos y, a continuación, utilizar la API BatchPutDocument
para indexar los mismos documentos o viceversa. El uso de un conector de fuente de Amazon Kendra
datos BatchPutDocument
y BatchDeleteDocument
APIs en combinación con él para el mismo conjunto de documentos podría provocar incoherencias con los datos. En su lugar, recomendamos utilizar el Amazon Kendra conector de origen de datos personalizado.
En los documentos de guía del desarrollador siguientes se muestra cómo añadir documentos directamente a un índice.
Añadir documentos con la API BatchPutDocument
En el siguiente ejemplo, se agrega un bloque de texto a un índice mediante una llamada BatchPutDocument. Puedes usar la BatchPutDocument
API para añadir documentos directamente a tu índice. Para obtener una lista de los tipos de documentos compatibles, Amazon Kendra consulte Tipos de documentos.
Para ver un ejemplo de cómo crear un índice con AWS CLI y SDKs, consulte Creación de un índice. Para configurar la CLI y SDKs, consulte Configuración Amazon Kendra.
nota
Los archivos añadidos al índice deben estar en un flujo de bytes codificado en UTF-8.
En los ejemplos siguientes, se añade al índice texto con codificación UTF-8.
Adición de documentos desde un bucket de S3
Puedes añadir documentos directamente a tu índice desde un Amazon S3 bucket mediante la BatchPutDocumentAPI. Puede añadir hasta 10 documentos en la misma llamada. Cuando utilizas un bucket de S3, debes proporcionar un IAM rol con permiso para acceder al bucket que contiene tus documentos. Especifique el rol en el parámetro RoleArn
.
El uso de la BatchPutDocumentAPI para añadir documentos desde un Amazon S3 depósito es una operación que se realiza una sola vez. Para mantener un índice sincronizado con el contenido de un depósito, cree una fuente de Amazon S3 datos. Para obtener más información, consulte Origen de datos de Amazon S3.
Para ver un ejemplo de cómo crear un índice con AWS CLI y SDKs, consulte Crear un índice. Para configurar la CLI y SDKs, consulte Configuración Amazon Kendra. Para obtener información sobre la creación de un bucket de S3, consulte la documentación de Amazon Simple Storage Service.
En el siguiente ejemplo, se agregan dos documentos de Microsoft Word al índice mediante la API BatchPutDocument
.