Índice - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Índice

Un índice contiene el contenido de los documentos y está estructurado de forma que permite realizar búsquedas en los documentos. La forma en que añada los documentos al índice depende de cómo los almacene.

  • Si guarda los documentos en algún tipo de repositorio, como unAmazon S3bucket o un Microsoft SharePoint sitio, usas unconector de fuente de datos:para indexar sus documentos desde su repositorio.

  • Si no guardas tus documentos en un repositorio, utilizas elBatchPutDocumentAPI para indexar tus documentos directamente.

  • Para las preguntas y respuestas de las preguntas frecuentes, que deben almacenarse en unAmazon Kendra(Amazon S3) cubo, los subes desde el cubo

Puede crear índices conAmazon Kendraconsola, laAWS CLI, o unAWSSDK. Para obtener información sobre los tipos de documentos que se pueden indexar, consulteTipos de documentos.

Uso deAmazon Kendracampos de documentos reservados o comunes

Con elUpdateIndex API, puede crear campos reservados o comunes utilizandoDocumentMetadataConfigurationUpdatesy especificando elAmazon Kendranombre de campo de índice reservado para asignarlo a su atributo/nombre de campo de documento equivalente. También puede crear campos personalizados. Si utiliza un conector de fuente de datos, la mayoría incluye asignaciones de campos que asignan los campos del documento de la fuente de datos aAmazon Kendraindexar campos. Si utiliza la consola, los campos se actualizan seleccionando la fuente de datos, seleccionando la acción de edición y, a continuación, pasando a la sección de mapeo de campos para configurar la fuente de datos.

Se puede configurar elSearchobjeto para establecer un campo como visualizable, facetable, buscable y ordenable. Se puede configurar elRelevanceobjeto para establecer el orden de clasificación de un campo, la duración o el período de tiempo para aplicarlo a la mejora, la frescura, el valor de importancia y los valores de importancia mapeados a valores de campo específicos. Si utiliza la consola, puede configurar la configuración de búsqueda de un campo seleccionando la opción de faceta en el menú de navegación. Para configurar el ajuste de relevancia, seleccione la opción de buscar en su índice en el menú de navegación, introduzca una consulta y utilice las opciones del panel lateral para ajustar la relevancia de la búsqueda. No puede cambiar el tipo de campo una vez creado el campo.

Amazon Kendratiene los siguientes campos de documento reservados o comunes que puede utilizar:

  • _authors—Una lista de uno o más autores responsables del contenido del documento.

  • _category—Una categoría que incluya un documento en un grupo específico.

  • _created_at—La fecha y la hora en formato ISO 8601 en que se creó el documento. Por ejemplo, 2012-03-25T12:30:10+01:00 es el formato de fecha y hora ISO 8601 para el 25 de marzo de 2012, a las 12.30 h (más 10 segundos) en el horario de Europa Central.

  • _data_source_id: el identificador de la fuente de datos que incluya el documento.

  • _document_body—El contenido del documento.

  • _document_id: un identificador único del documento.

  • _document_title: el título del documento.

  • _excerpt_page_number—El número de página en un archivo PDF en el que aparezca un extracto del documento. Si el índice se creó antes del 8 de septiembre de 2020, debe volver a indexar los documentos antes de poder utilizar este atributo.

  • _faq_id—Si se trata de un documento tipo pregunta-respuesta (FAQ), un identificador único para la FAQ.

  • _file_type—El tipo de archivo del documento, como un formato pdf o un documento.

  • _last_updated_at—La fecha y la hora en formato ISO 8601 en que el documento se actualizó por última vez. Por ejemplo, 2012-03-25T12:30:10+01:00 es el formato de fecha y hora ISO 8601 para el 25 de marzo de 2012, a las 12.30 h (más 10 segundos) en el horario de Europa Central.

  • _source_uri: la URI en la que está disponible el documento. Por ejemplo, el URI del documento en el sitio web de una empresa.

  • _version: un identificador para la versión específica de un documento.

  • _view_count—El número de veces que se haya visto el documento.

  • _language_code(String): el código del idioma que incluya un documento. El formato predeterminado es inglés si no especifique un idioma. Para obtener más información sobre los idiomas compatibles, incluidos sus códigos, consulteAñadir documentos en un idioma que no sea el inglés.

En el caso de los campos personalizados, estos campos se crean medianteDocumentMetadataConfigurationUpdatescon elUpdateIndexAPI, igual que cuando se crea un campo reservado o común. Debe establecer el tipo de datos adecuado para su campo personalizado. Si utiliza la consola, los campos se actualizan seleccionando la fuente de datos, seleccionando la acción de edición y, a continuación, pasando a la sección de mapeo de campos para configurar la fuente de datos. Algunas fuentes de datos no admiten la adición de campos nuevos o campos personalizados. No puede cambiar el tipo de campo una vez creado el campo.

Los siguientes son los tipos que puede configurar para los campos personalizados:

  • Fecha

  • Número

  • Cadena

  • Lista de cadenas

Si ha añadido documentos al índice utilizandoBatchPutDocumentAPI,Attributesmuestra los campos/atributos de sus documentos y usted crea campos conDocumentAttributeobjeto.

Para los documentos indexados desde unAmazon S3fuente de datos, los campos se crean mediante unArchivo de metadatos JSONque incluye la información de los campos.

Si utiliza una base de datos compatible como fuente de datos, puede configurar los campos medianteopción de mapeo de campos:.

Buscando índices

Tras crear un índice, puede empezar a buscar en sus documentos. Para obtener más información, consulteBúsqueda de índices.