Paso 3: Formato de la salida del análisis de entidades como metadatos de Amazon Kendra - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Paso 3: Formato de la salida del análisis de entidades como metadatos de Amazon Kendra

Para convertir las entidades extraídas por Amazon Comprehend al formato de metadatos requerido por un índice de Amazon Kendra, ejecuta un script de Python 3. Los resultados de la conversión se almacenan en elmetadatacarpeta de su bucket de Amazon S3.

Para obtener más información sobre el formato y la estructura de metadatos de Amazon Kendra, consulte.Metadatos de documentos S3.

Descarga y extracción de la salida de Amazon Comprehend

Para dar formato a la salida del análisis de entidades de Amazon Comprehend, primero debe descargar el análisis de entidades de Amazon Comprehend.output.tar.gzarchivar y extraer el archivo de análisis de entidades.

  1. En el panel de navegación de la consola de Amazon Comprehend, vaya aTrabajos de análisis.

  2. Elija el trabajo de análisis de entidadesdata-entities-analysis.

  3. UNDERSalida, elija el enlace que se muestra junto aUbicación de los datos de salida. Esto le redirige aloutput.tar.gzarchivo en su bucket de S3.

  4. En el navegadorResumen, elijaDescargar.

    sugerencia

    Los resultados de todos los trabajos de análisis de Amazon Comprehend tienen el mismo nombre. Cambiar el nombre de tu archivo te ayudará a rastrearlo con más facilidad.

  5. Descomprime y extrae el archivo de Amazon Comprehend descargado en tu dispositivo.

  1. Para acceder al nombre de la carpeta generada automáticamente de Amazon Comprehend del bucket de S3, que contiene los resultados del trabajo de análisis de entidades, utilice eldescribe-entidaes-detection-trabajocomando:

    Linux
    aws comprehend describe-entities-detection-job \ --job-id entities-job-id \ --region aws-region

    Donde:

    macOS
    aws comprehend describe-entities-detection-job \ --job-id entities-job-id \ --region aws-region

    Donde:

    Windows
    aws comprehend describe-entities-detection-job ^ --job-id entities-job-id ^ --region aws-region

    Donde:

  2. desde lasOutputDataConfigobjeto en la descripción del trabajo de las entidades, copia y guarda elS3Urivalor comocomprehend-S3urien un editor de texto.

    nota

    LaS3Urivalue tiene un formato similar as3://DOC-EXAMPLE-BUCKET/... /output/output.tar.gz que es.

  3. Para descargar el archivo de salida de entidades, utilice elcopiacomando:

    Linux
    aws s3 cp s3://DOC-EXAMPLE-BUCKET/.../output/output.tar.gz path/output.tar.gz

    Donde:

    • s3://DOC-EXAMPLE-BUCKET/... /output/output.tar.gz que eses elS3Urivalor que has guardado comocomprehend-S3uri,

    • pathes el directorio local en el que desea guardar la salida.

    macOS
    aws s3 cp s3://DOC-EXAMPLE-BUCKET/.../output/output.tar.gz path/output.tar.gz

    Donde:

    • s3://DOC-EXAMPLE-BUCKET/... /output/output.tar.gz que eses elS3Urivalor que has guardado comocomprehend-S3uri,

    • pathes el directorio local en el que desea guardar la salida.

    Windows
    aws s3 cp s3://DOC-EXAMPLE-BUCKET/.../output/output.tar.gz path/output.tar.gz

    Donde:

    • s3://DOC-EXAMPLE-BUCKET/... /output/output.tar.gz que eses elS3Urivalor que has guardado comocomprehend-S3uri,

    • pathes el directorio local en el que desea guardar la salida.

  4. Para extraer la salida de las entidades, ejecute el siguiente comando en una ventana de terminal:

    Linux
    tar -xf path/output.tar.gz -C path/

    Donde:

    • pathes la ruta de archivo a la descargadaoutput.tar.gzarchivo en su dispositivo local.

    macOS
    tar -xf path/output.tar.gz -C path/

    Donde:

    • pathes la ruta de archivo a la descargadaoutput.tar.gzarchivo en su dispositivo local.

    Windows
    tar -xf path/output.tar.gz -C path/

    Donde:

    • pathes la ruta de archivo a la descargadaoutput.tar.gzarchivo en su dispositivo local.

Al final de este paso, tendrá un archivo en el dispositivo denominadooutputcon una lista de entidades identificadas por Amazon Comprehend.

Carga de la salida en el bucket de S3

Después de descargar y extraer el archivo de análisis de entidades de Amazon Comprehend, se carga el archivo extraídooutputen su bucket de Amazon S3.

  1. Abra la consola de Amazon S3 en https://console.aws.amazon.com/s3.

  2. EnBuckets, haga clic en el nombre de su bucket y, a continuación, seleccioneCargar.

  3. EnArchivos y carpetas, eligeAñada archivos.

  4. En el cuadro de diálogo, vaya a la extracción deoutputEn el dispositivo, selecciónela y elijaAbierto.

  5. Mantenga la configuración predeterminada paraDestino,Permisos, yPropiedades.

  6. Seleccione Upload (Cargar).

  1. Para cargar el extraídooutputarchivo en su bucket de, use elcopiacomando:

    Linux
    aws s3 cp path/output s3://DOC-EXAMPLE-BUCKET/output

    Donde:

    • pathes la ruta de archivo local a su extraídooutputarchivo,

    • DOC-EXAMPLE-BUCKETes el nombre del bucket de S3.

    macOS
    aws s3 cp path/output s3://DOC-EXAMPLE-BUCKET/output

    Donde:

    • pathes la ruta de archivo local a su extraídooutputarchivo,

    • DOC-EXAMPLE-BUCKETes el nombre del bucket de S3.

    Windows
    aws s3 cp path/output s3://DOC-EXAMPLE-BUCKET/output

    Donde:

    • pathes la ruta de archivo local a su extraídooutputarchivo,

    • DOC-EXAMPLE-BUCKETes el nombre del bucket de S3.

  2. Para garantizar que eloutputse ha cargado correctamente en el depósito de S3, compruebe su contenido utilizando ellistacomando:

    Linux
    aws s3 ls s3://DOC-EXAMPLE-BUCKET/

    Donde:

    • DOC-EXAMPLE-BUCKETes el nombre del bucket de S3.

    macOS
    aws s3 ls s3://DOC-EXAMPLE-BUCKET/

    Donde:

    • DOC-EXAMPLE-BUCKETes el nombre del bucket de S3.

    Windows
    aws s3 ls s3://DOC-EXAMPLE-BUCKET/

    Donde:

    • DOC-EXAMPLE-BUCKETes el nombre del bucket de S3.

Conversión de la salida a formato de metadatos de Amazon Kendra

Para convertir la salida de Amazon Comprehend en metadatos de Amazon Kendra, ejecuta un script de Python 3. Si utiliza la consola, useAWS CloudShellpara este paso.

  1. Descarga deconvertidor.py.ziparchivo comprimido en tu dispositivo.

  2. Extraer el archivo Python 3converter.py.

  3. Inicie sesión en elAWSConsola de administración dey asegúrese de que suAWSregion se establece en la misma región que su bucket de S3 y su trabajo de análisis de Amazon Comprehend.

  4. Elija el iconoAWS CloudShelliconoo tipoAWSCloudShellen laBúsquedaEn la barra de navegación superior para iniciar un entorno.

    nota

    CuandoAWS CloudShellse inicia por primera vez en una nueva ventana del navegador, un panel de bienvenida muestra y enumera las características clave. El shell está listo para la interacción después de cerrar este panel y se muestra el símbolo del sistema.

  5. Una vez preparada la terminal, elijaActionsen el panel de navegación y, a continuación, elijaCargar archivodel menú.

  6. En el cuadro de diálogo que se abre, elijaSeleccionar archivoy, a continuación, elija el archivo Python 3 descargadoconverter.pydesde tu dispositivo. Seleccione Upload (Cargar).

  7. En el navegadorAWS CloudShellEnvironment, escriba el siguiente comando:

    python3 converter.py
  8. Cuando la interfaz de shell le pide queIntroduzca el nombre del bucket de S3, escriba el nombre del bucket de S3 y pulse Intro.

  9. Cuando la interfaz de shell le pide queIntroduzca la ruta de archivo completa del archivo de salida Comprehend, introduzcaoutputy presiona enter.

  10. Cuando la interfaz de shell le pide queIntroduzca la ruta de archivo completa a la carpeta de metadatos, introduzcametadata/y presiona enter.

importante

Para que los metadatos se formateen correctamente, los valores de entrada de los pasos 8 a 10 deben ser exactos.

  1. Para descargar el archivo Python 3converter.py, ejecute el siguiente comando en una ventana de terminal:

    Linux
    curl -o path/converter.py.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/converter.py.zip

    Donde:

    • pathes la ruta de archivo a la ubicación en la que desea guardar el archivo comprimido.

    macOS
    curl -o path/converter.py.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/converter.py.zip

    Donde:

    • pathes la ruta de archivo a la ubicación en la que desea guardar el archivo comprimido.

    Windows
    curl -o path/converter.py.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/converter.py.zip

    Donde:

    • pathes la ruta de archivo a la ubicación en la que desea guardar el archivo comprimido.

  2. Para extraer el archivo de Python 3, ejecute el siguiente comando en la ventana de la terminal:

    Linux
    unzip path/converter.py.zip -d path/

    Donde:

    • pathes la ruta de archivo a tu guardadoconverter.py.zip.

    macOS
    unzip path/converter.py.zip -d path/

    Donde:

    • pathes la ruta de archivo a tu guardadoconverter.py.zip.

    Windows
    tar -xf path/converter.py.zip -C path/

    Donde:

    • pathes la ruta de archivo a tu guardadoconverter.py.zip.

  3. Asegúrese de que Boto3 esté instalado en el dispositivo mediante la ejecución del siguiente comando.

    Linux
    pip3 show boto3
    macOS
    pip3 show boto3
    Windows
    pip3 show boto3
    nota

    Si no tiene Boto3 instalado, ejecutepip3 install boto3para instalarlo.

  4. Para ejecutar el script de Python 3 para convertir eloutput, ejecute el siguiente comando.

    Linux
    python path/converter.py

    Donde:

    • pathes la ruta de archivo a tu guardadoconverter.py.zip.

    macOS
    python path/converter.py

    Donde:

    • pathes la ruta de archivo a tu guardadoconverter.py.zip.

    Windows
    python path/converter.py

    Donde:

    • pathes la ruta de archivo a tu guardadoconverter.py.zip.

  5. CuandoAWS CLIle pide queEnter the name of your S3 bucket, escriba el nombre del bucket de S3 y pulse Intro.

  6. CuandoAWS CLIle pide queEnter the full filepath to your Comprehend output file, introduzcaoutputy presiona enter.

  7. CuandoAWS CLIle pide queEnter the full filepath to your metadata folder, introduzcametadata/y presiona enter.

importante

Para que los metadatos se formateen correctamente, los valores de entrada de los pasos 5 a 7 deben ser exactos.

Al final de este paso, los metadatos formateados se depositan dentro delmetadatacarpeta en el bucket de S3.

Limpieza del bucket de Amazon S3

Dado que el índice de Amazon Kendra sincroniza todos los archivos almacenados en un depósito, te recomendamos que limpies tu depósito de Amazon S3 para evitar resultados de búsqueda redundantes.

  1. Abra la consola de Amazon S3 en https://console.aws.amazon.com/s3.

  2. EnBuckets, elija su bucket y, a continuación, seleccione la carpeta de salida de análisis de entidades de Amazon Comprehend, el análisis de entidades de Amazon Comprehend.tempy Amazon Comprehend extraídooutputfile.

  3. desde lasResumenpestaña elegirBorrar.

  4. EnEliminar objetos, elige¿Eliminar objetos de forma permanente?e introduzcapermanently deleteen el campo de entrada de texto.

  5. Elija Delete objects (Eliminar objetos).

  1. Para eliminar todos los archivos y carpetas del depósito de S3, excepto eldataymetadatacarpetas, utilice laquitarcomando en elAWS CLI:

    Linux
    aws s3 rm s3://DOC-EXAMPLE-BUCKET/ --recursive --exclude "data/*" --exclude "metadata/*"

    Donde:

    • DOC-EXAMPLE-BUCKETes el nombre del bucket de S3.

    macOS
    aws s3 rm s3://DOC-EXAMPLE-BUCKET/ --recursive --exclude "data/*" --exclude "metadata/*"

    Donde:

    • DOC-EXAMPLE-BUCKETes el nombre del bucket de S3.

    Windows
    aws s3 rm s3://DOC-EXAMPLE-BUCKET/ --recursive --exclude "data/*" --exclude "metadata/*"

    Donde:

    • DOC-EXAMPLE-BUCKETes el nombre del bucket de S3.

  2. Para asegurarse de que los objetos se hayan eliminado correctamente del depósito de S3, compruebe su contenido mediante lalistacomando:

    Linux
    aws s3 ls s3://DOC-EXAMPLE-BUCKET/

    Donde:

    • DOC-EXAMPLE-BUCKETes el nombre del bucket de S3.

    macOS
    aws s3 ls s3://DOC-EXAMPLE-BUCKET/

    Donde:

    • DOC-EXAMPLE-BUCKETes el nombre del bucket de S3.

    Windows
    aws s3 ls s3://DOC-EXAMPLE-BUCKET/

    Donde:

    • DOC-EXAMPLE-BUCKETes el nombre del bucket de S3.

Al final de este paso, ha convertido el resultado del análisis de entidades de Amazon Comprehend en metadatos de Amazon Kendra. Ahora está listo para crear un índice de Amazon Kendra.