Creación de campos de documento personalizados - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Creación de campos de documento personalizados

Puede crear atributos o campos personalizados para sus documentos en su índice de Amazon Kendra. Por ejemplo, puede crear un campo o atributo personalizado denominado “Departamento” con los valores de “RR. HH.”, “Ventas” y “Fabricación”. Si asigna estos campos o atributos personalizados a su índice de Amazon Kendra, puede usarlos para filtrar los resultados de la búsqueda e incluir documentos por el atributo del departamento «Recursos humanos», por ejemplo.

Para poder utilizar un campo o atributo personalizado, primero debe crear el campo en el índice. Utilice la consola para editar las asignaciones de campos de la fuente de datos y añadir un campo personalizado o utilice la UpdateIndexAPI para crear el campo de índice. No puede cambiar el tipo de dato del campo una vez que este se ha creado.

Para la mayoría de orígenes de datos, asignará los campos del origen de datos externo a los campos correspondientes en Amazon Kendra. Para obtener más información, consulte Asignación de campos de origen de datos. Para los orígenes de datos de S3, puede crear atributos o campos personalizados mediante un archivo de metadatos JSON.

Puede crear hasta 500 campos o atributos personalizados.

También puede usar campos Amazon Kendra reservados o comunes. Para obtener más información, consulte Atributos o campos del documento.

Actualización de campos de documentos personalizados

Con la API UpdateIndex, se agregan campos o atributos personalizados mediante el parámetro DocumentMetadataConfigurationUpdates.

En el siguiente ejemplo de JSON se utiliza DocumentMetadataConfigurationUpdates para agregar al índice un campo denominado “Department”.

"DocumentmetadataConfigurationUpdates": [ { "Name": "Department", "Type": "STRING_VALUE" } ]

En las siguientes secciones se incluyen ejemplos para añadir atributos o campos personalizados mediante BatchPutDocumenty para una fuente de datos de Amazon S3.

Añadir atributos o campos personalizados con la BatchPutDocument API

Cuando utilizas la BatchPutDocumentAPI para añadir un documento a tu índice, especificas campos o atributos personalizados como parte de ellaAttributes. Puede añadir varios campos o atributos al llamar a la API. Puede crear hasta 500 campos o atributos personalizados. El siguiente ejemplo es un campo o atributo personalizado que agrega “Departamento” a un documento.

"Attributes": { "Department": "HR", "_category": "Vacation policy" }

Adición de atributos o campos personalizados a un origen de datos de Amazon S3

Cuando se utilice un bucket de S3 como origen de datos para el índice, se agregan metadatos a los documentos con archivos de metadatos complementarios. Los archivos JSON de metadatos se colocan en una estructura de directorios paralela a los documentos. Para obtener más información, consulte Metadatos de documentos de S3.

Los campos o atributos personalizados se especifican en la estructura JSON de Attributes. Puede crear hasta 500 campos o atributos personalizados. Por ejemplo, en el siguiente ejemplo se utiliza Attributes para definir tres campos o atributos personalizados y un campo reservado.

"Attributes": { "brand": "Amazon Basics", "price": 1595, "_category": "sports", "subcategories": ["outdoors", "electronics"] }

En los siguientes pasos, se explica cómo añadir atributos personalizados a una fuente de datos de Amazon S3.

Paso 1: Crear un índice de Amazon Kendra

Sigue los pasos Creación de un índice que se indican para crear tu índice de Amazon Kendra.

Paso 2: Actualice el índice para añadir campos de documentos personalizados

Después de crear un índice, se le añaden campos. El siguiente procedimiento muestra cómo agregar campos a un índice mediante la consola y la CLI.

Console
Para crear campos de índice
  1. Asegúrese de haber creado un índice.

  2. A continuación, en el menú de navegación de la izquierda, en Administración de datos, selecciona Definición de facetas.

  3. En la guía de configuración de campos de índice, en Campos de índice, selecciona Añadir campo para añadir campos personalizados.

  4. En el cuadro de diálogo Agregar campo de índice, haga lo siguiente:

    • Nombre de campo: agrega un nombre de campo.

    • Tipo de datos: seleccione el tipo de datos, ya sea cadena, lista de cadenas o fecha.

    • Tipos de uso: seleccione los tipos de uso, ya sean facetables, buscables, visualizables y ordenables.

      A continuación, selecciona Añadir.

    Repita el último paso para cualquier otro campo que desee mapear.

CLI
aws kendra update-index \ --region $region \ --endpoint-url $endpoint \ --application-id $applicationId \ --index-id $indexId \ --document-metadata-configuration-updates \ "[ { "Name": "string", "Type": "STRING_VALUE"|"STRING_LIST_VALUE"|"LONG_VALUE"|"DATE_VALUE", "Relevance": { "Freshness": true|false, "Importance": integer, "Duration": "string", "RankOrder": "ASCENDING"|"DESCENDING", "ValueImportanceMap": {"string": integer ...} }, "Search": { "Facetable": true|false, "Searchable": true|false, "Displayable": true|false, "Sortable": true|false } } ... ]"

Paso 3: Cree una fuente de datos de Amazon S3 y asigne los campos de la fuente de datos a atributos personalizados

Para crear una fuente de datos de Amazon S3 y asignarle campos, siga las instrucciones que se indican enAmazon S3.

Si utiliza la API, utilice el fieldMappings atributo que aparece debajo configuration cuando utilice la CreateDataSourceAPI.

Para obtener una descripción general de cómo se mapean los campos de las fuentes de datos, consulteAsignación de campos de origen de datos.