Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Paso 1: Añadir documentos a Amazon S3
Antes de ejecutar un trabajo de análisis de entidades de Amazon Comprehend en su conjunto de datos, debe crear un bucket de Amazon S3 para alojar los datos, los metadatos y el resultado del análisis de entidades de Amazon Comprehend.
Temas
Descarga del conjunto de datos de muestra
Antes de que Amazon Comprehend pueda ejecutar un trabajo de análisis de entidades en sus datos, debe descargar y extraer el conjunto de datos y cargarlo en un bucket de S3.
-
Descargue la carpeta tutorial-dataset.zip en su dispositivo.
-
Extraiga la carpeta
tutorial-dataset
para acceder a la carpetadata
.
-
Para descargar el
tutorial-dataset
, ejecute el siguiente comando en una ventana de terminal: -
Para extraer los datos de la carpeta zip, ejecute el siguiente comando en la ventana del terminal:
Al final de este paso, deberías tener los archivos extraídos en una carpeta descomprimida llamada tutorial-dataset
. Esta carpeta contiene un archivo README
con una atribución de código abierto de Apache 2.0 y una carpeta llamada data
que contiene el conjunto de datos de este tutorial. El conjunto de datos consta de 100 archivos con extensiones .story
.
Creación de un bucket de Amazon S3
Después de descargar y extraer la carpeta de datos de muestra, se almacena en un bucket de Amazon S3.
importante
El nombre de un bucket de Amazon S3 debe ser único en todas las AWS.
Inicie sesión en la consola de Amazon S3 AWS Management Console y ábrala en https://console.aws.amazon.com/s3/
. -
En Buckets, seleccione Crear bucket.
-
En Nombre del bucket, escriba un nombre único.
-
En Región, elige la AWS región en la que quieres crear el bucket.
nota
Debe elegir una región que admita Amazon Comprehend y Amazon Kendra. No puede cambiar la región de un bucket después de haberlo creado.
-
Mantenga la configuración predeterminada para Bloquear el acceso público para este bucket, el control de versiones del bucket y las etiquetas.
-
Para el cifrado predeterminado, seleccione Desactivar.
-
Mantenga la configuración predeterminada para la Configuración avanzada.
-
Revise la configuración del bucket y elija Crear bucket.
-
Para crear un bucket de S3 use el comando create-bucket
en la AWS CLI. nota
Debe elegir una región que admita Amazon Comprehend y Amazon Kendra. No puede cambiar la región de un bucket después de haberlo creado.
-
Para asegurarse de que su bucket se creó correctamente, utilice el comando list
:
Crear carpetas de datos y metadatos en su bucket de S3
Tras crear su bucket S3, cree carpetas de datos y metadatos en su interior.
Abra la consola Amazon S3 en https://console.aws.amazon.com/s3/
. -
En Buckets, haga clic en el nombre de su bucket de la lista.
-
En la pestaña Objetos, elija Crear carpeta.
-
Para el nombre de la nueva carpeta, escriba
data
. -
Para la configuración de cifrado de carpeta, elija Desactivar.
-
Elija Crear carpeta.
-
Repita los pasos 3 a 6 para crear otra carpeta para almacenar los metadatos de Amazon Kendra y asigne un nombre a la carpeta creada en el paso 4
metadata
.
-
Para crear la carpeta
data
en su bucket de S3, utilice el comando put-objecten la AWS CLI: -
Para crear la carpeta
metadata
en su bucket de S3, utilice el comando put-objecten la AWS CLI: -
Para asegurarse de que sus carpetas se han creado correctamente, compruebe el contenido de su bucket utilizando el comando list
:
Cargar los datos de entrada.
Tras crear las carpetas de datos y metadatos, debe cargar el conjunto de datos de muestra en la carpeta data
.
Abra la consola Amazon S3 en https://console.aws.amazon.com/s3/
. -
En Buckets, haga clic en el nombre de su bucket de la lista y haga clic en
data
. -
Elija Cargar y, a continuación, Agregar archivo.
-
En el cuadro de diálogo, navegue hasta la carpeta
data
incluida en la carpetatutorial-dataset
de su dispositivo local, seleccione todos los archivos y, a continuación, elija Abrir. -
Mantenga la configuración predeterminada de Destino, Permisos y Propiedades.
-
Seleccione Cargar.
Al final de este paso, dispondrá de un bucket de S3 con el conjunto de datos almacenado en la carpeta data
y de una carpeta metadata
vacía en la que se almacenarán los metadatos de Amazon Kendra.