Índice - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Índice

Un índice contiene el contenido de sus documentos y está estructurado de manera que se puedan buscar en los documentos. La forma de añadir documentos al índice depende de cómo se almacenen los documentos.

  • Si almacenas tus documentos en algún tipo de repositorio, como unAmazon S3bucket o Microsoft SharePoint , utilizas unconector de origen de datospara indexar los documentos de su repositorio.

  • Si no almacena sus documentos en un repositorio, utiliza laBatchPutDocumentAPI para indexar directamente tus documentos.

  • Para las preguntas y respuestas de FAQ, que deben almacenarse en unAmazon Kendra(Amazon S3), los subes desde el depósito

Puede crear índices con elAmazon KendraConsola deAWS CLI, o unAWSSDK. Para obtener información acerca de los tipos de documentos que se pueden indexar, consulteTipos de documentos de .

Campos de índice

Un índice contiene campos que se asignan a los atributos del documento. Los atributos pueden incluir, por ejemplo, el título del documento, el texto principal, la fecha de la última actualización y otros atributos incluidos en la estructura de los documentos. También puede crear atributos personalizados, como la descripción de la figura o el departamento empresarial al que está asociado el documento. Los campos de índice, que se asignan a los atributos del documento, proporcionan el esquema del índice.Amazon Kendrautiliza los campos para buscar en los documentos. Después de asignar los campos a los atributos del documento, puede utilizar la información del campo para realizar búsquedas.

Amazon Kendratiene 15 campos reservados, que puede asignar a los atributos del documento:

  • _authors: lista de uno o más autores responsables del contenido del documento.

  • _category: categoría que coloca un documento en un grupo específico.

  • _created_at: fecha y hora en formato ISO 8601 de creación del documento. Por ejemplo, 2012-03-25T 12:30:10 + 01:00 es el formato de fecha y hora ISO 8601 para el 25 de marzo de 2012, a las 12.30 h (más 10 segundos), hora de Europa Central.

  • _data_source_id: el identificador de la fuente de datos que contiene el documento.

  • _document_body: el contenido del documento.

  • _document_id: un identificador único para el documento.

  • _document_title: título del documento.

  • _excerpt_page_number: el número de página de un archivo PDF en el que aparece el extracto del documento. Si el índice se creó antes del 8 de septiembre de 2020, debe volver a indexar los documentos antes de poder utilizar este atributo.

  • _faq_id—Si se trata de una pregunta frecuente y su respuesta, un identificador único para ellas.

  • _file_type: el tipo de archivo del documento, como pdf o doc.

  • _last_updated_at: fecha y hora en formato ISO 8601 de última actualización del documento. Por ejemplo, 2012-03-25T 12:30:10 + 01:00 es el formato de fecha y hora ISO 8601 para el 25 de marzo de 2012, a las 12.30 h (más 10 segundos), hora de Europa Central.

  • _source_uri: el URI en el que está disponible el documento. Por ejemplo, el URI del documento en el sitio web de una empresa.

  • _version: un identificador de la versión específica de un documento.

  • _view_count: el número de veces visto el documento.

  • _language_code(cadena): el código de un idioma que se aplica al documento. Este valor se define por defecto en inglés si no especifica un idioma. Para obtener más información sobre los idiomas admitidos, incluidos sus códigos, consulteAdición de documentos en idiomas distintos del inglés.

También puede crear campos personalizados, que puede usar como los campos reservados para buscar y mostrar, y para crear facetas.

Hay cuatro tipos de campos personalizados:

  • Fecha

  • Número

  • Cadena

  • Lista de cadenas

Puede crear un campo personalizado mediante la consola o mediante elUpdateIndexAPI. Después de crear un campo personalizado, lo asigna a un atributo de documento, del mismo modo que lo hace con un campo reservado. Si ha añadido un documento al índice conBatchPutDocumentAPI, asigne los atributos a la API. Para documentos indexados desde unAmazon S3fuente de datos, asigne los atributos mediante un archivo de metadatos que contiene una estructura JSON que describe los atributos del documento. Para los documentos indexados con una base de datos o una fuente de datos que permiten la asignación de campos, debe asignar los atributos con la consola o la configuración de la fuente de datos. Para obtener más información, consulteBúsqueda de índices.

Búsqueda de índices

Después de crear un índice, puede iniciar la búsqueda en los documentos. Para obtener más información, consulteBúsqueda de índices.