Amazon S3metadatos de documento - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Amazon S3metadatos de documento

Puede agregar metadatos, información adicional sobre un documento, a documentos de unAmazon S3bucket utilizando un archivo de metadatos. Cada archivo de metadatos está asociado a un documento indexado.

Los archivos de metadatos deben almacenarse en el mismo depósito que los archivos indexados. Puede especificar una ubicación dentro del depósito para los archivos de metadatos mediante la consola o elS3Prefixde laDocumentsMetadataConfigurationparámetro al crear unAmazon S3origen de datos. Si no especifica unAmazon S3, los archivos de metadatos deben almacenarse en la misma ubicación que los documentos indexados.

Si especifica unAmazon S3prefijo para los archivos de metadatos, se encuentran en una estructura de directorios parallel a los documentos indexados.Amazon Kendrasolo busca los metadatos en el directorio especificado. Si los metadatos no se leen, compruebe que la ubicación del directorio coincida con la ubicación de los metadatos.

En los siguientes ejemplos se muestra cómo se asigna la ubicación del documento indexado a la ubicación del archivo de metadatos. Observe que el documentoAmazon S3se anexa a los metadatosAmazon S3prefijo y, a continuación, sufijo con.metadata.jsonpara formar el archivo de metadatosAmazon S3path. El combinadoAmazon S3clave, con los metadatosAmazon S3prefijo y.metadata.jsonEl sufijo no puede tener más de un total de 1024 caracteres. Se recomienda que conserve suAmazon S3clave inferior a 1000 caracteres para tener en cuenta los caracteres adicionales al combinar la clave con el prefijo y el sufijo.

Bucket name: s3://bucketName Document path: documents Metadata path: none File mapping s3://bucketName/documents/file.txt -> s3://bucketName/documents/file.txt.metadata.json
Bucket name: s3://bucketName Document path: documents/legal Metadata path: metadata File mapping s3://bucketName/documents/legal/file.txt -> s3://bucketName/metadata/documents/legal/file.txt.metadata.json

Los metadatos de los documentos se definen en un archivo JSON. El archivo debe ser un archivo de texto UTF-8 sin marcador de lista de materiales. El nombre de archivo JSON debe serdocument.extension.metadata.json. En él, «documento» es el nombre del documento al que se aplican los metadatos y «extensión» es la extensión de archivo del documento.

El contenido del archivo JSON sigue a esta plantilla. Todos los atributos son opcionales. Si no especifica el_source_uri, luego los enlaces devueltos porAmazon Kendraen los resultados de búsqueda apuntan a laAmazon S3bucket que contiene el documento.

{ "DocumentId": "document ID", "Attributes": { "_category": "document category", "_created_at": "ISO 8601 encoded string", "_last_updated_at": "ISO 8601 encoded string", "_source_uri": "document URI", "_version": "file version", "_view_count": number of times document has been viewed, "custom attribute key": "custom attribute value", additional custom attributes }, "AccessControlList": [ { "Name": "user name", "Type": "GROUP | USER", "Access": "ALLOW | DENY" } ], "Title": "document title", "ContentType": "HTML | MS_WORD | PDF | PLAIN_TEXT | PPT" }

La_created_aty_last_updated_atlos campos de metadatos son fechas codificadas con ISO 8601. Por ejemplo, 2012-03-25T12:30:10+01:00 es el formato de fecha y hora ISO 8601 para el 25 de marzo de 2012, a las 12.30 h (más 10 segundos) en la zona horaria de Europa Central.

Puede añadir información adicional a laAttributessobre un documento que utiliza para filtrar consultas o agrupar respuestas a consultas. Para obtener más información, consulte Creación de atributos de documento personalizados.

Puede utilizar elAccessControlListpara filtrar la respuesta de una consulta. De esta forma, solo algunos usuarios y grupos tienen acceso a los documentos. Para obtener más información, consulte Filtrado en contexto de usuario.