Tutorial: Creación de una solución de búsqueda inteligente enriquecida con metadatos con Amazon Kendra - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Tutorial: Creación de una solución de búsqueda inteligente enriquecida con metadatos con Amazon Kendra

En este tutorial se muestra cómo crear una solución de búsqueda inteligente enriquecida con metadatos, basada en lenguaje natural para sus datos empresariales medianteAmazon Kendra,Amazon Comprehend,Amazon Simple Storage Service(S3) yAWS CloudShell.

Amazon Kendra es un servicio de búsqueda inteligente que puede crear un índice de búsqueda para sus repositorios de datos de lenguaje natural no estructurados. Para facilitar a sus clientes encontrar y filtrar las respuestas relevantes, puede utilizar Amazon Comprehend para extraer metadatos de sus datos e incorporarlos en su índice de búsqueda de Amazon Kendra.

Amazon Comprehend es un servicio de procesamiento de lenguaje natural (PNL) que puede identificar entidades. Las entidades son referencias a personas, lugares, ubicaciones, organizaciones y objetos de los datos.

En este tutorial se utiliza un conjunto de datos de ejemplo de artículos de noticias para extraer entidades, convertirlas en metadatos e incorporarlas en su índice de Amazon Kendra para realizar búsquedas. Los metadatos añadidos le permiten filtrar los resultados de búsqueda utilizando cualquier subconjunto de estas entidades y mejora la precisión de la búsqueda. Siguiendo este tutorial, aprenderá a crear una solución de búsqueda para los datos empresariales sin ningún conocimiento especializado de aprendizaje automático.

En este tutorial se muestra cómo crear la solución de búsqueda siguiendo los pasos que se describen a continuación:

  1. Almacenar un conjunto de datos de ejemplo de artículos de noticias en Amazon S3.

  2. Uso de Amazon Comprehend para extraer entidades de sus datos.

  3. Ejecución de un script de Python 3 para convertir las entidades en formato de metadatos de índice de Amazon Kendra y almacenar estos metadatos en S3.

  4. Crear un índice de búsqueda de Amazon Kendra e ingerir los datos y los metadatos.

  5. Consultar el índice de búsqueda.

En el siguiente diagrama se muestra el flujo de trabajo:


   Diagrama de flujo de trabajo de los procedimientos del tutorial.

Tiempo estimado para completar este tutorial:1 hora

Costo estimado: Algunas de las acciones de este tutorial incurren en cargos en tuAWSaccount. Para obtener más información sobre el costo de cada servicio, consulte las páginas de precios deAmazon S3,Amazon Comprehend,AWS CloudShell, yAmazon Kendra.

Requisitos previos

Para completar este tutorial, necesita los siguientes recursos:

  • Una cuenta de AWS. Si no dispone de unAWScuenta, siga los pasos deConfiguración de Amazon Kendrapara configurar suAWSaccount.

  • Un equipo de desarrollo con Windows, macOS o Linux para acceder a laAWSConsola de administración. Para obtener más información, consulteConfiguración deAWSConsola de administración de.

  • UnAWS Identity and Access Managementusuario (IAM). Para obtener información sobre cómo configurar un usuario y un grupo de IAM para su cuenta, consulte laIntroducciónen la sección deIAM User Guide.

    Si utiliza elAWS Command Line Interface, también debe adjuntar la siguiente política a su usuario de IAM para otorgarle los permisos básicos necesarios para completar este tutorial.

    { "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "iam:GetUserPolicy", "iam:DeletePolicy", "iam:CreateRole", "iam:AttachRolePolicy", "iam:DetachRolePolicy", "iam:AttachUserPolicy", "iam:DeleteRole", "iam:CreatePolicy", "iam:GetRolePolicy", "s3:CreateBucket", "s3:ListBucket", "s3:DeleteObject", "s3:DeleteBucket", "s3:PutObject", "s3:GetObject", "s3:ListAllMyBuckets", "comprehend:StartEntitiesDetectionJob", "comprehend:BatchDetectEntities", "comprehend:ListEntitiesDetectionJobs", "comprehend:DescribeEntitiesDetectionJob", "comprehend:StopEntitiesDetectionJob", "comprehend:DetectEntities", "kendra:Query", "kendra:StopDataSourceSyncJob", "kendra:CreateDataSource", "kendra:BatchPutDocument", "kendra:DeleteIndex", "kendra:StartDataSourceSyncJob", "kendra:CreateIndex", "kendra:ListDataSources", "kendra:UpdateIndex", "kendra:DescribeIndex", "kendra:DeleteDataSource", "kendra:ListIndices", "kendra:ListDataSourceSyncJobs", "kendra:DescribeDataSource", "kendra:BatchDeleteDocument" ], "Resource": "*" }, { "Sid": "iamPassRole", "Effect": "Allow", "Action": "iam:PassRole", "Resource": "*", "Condition": { "StringEquals": { "iam:PassedToService": [ "s3.amazonaws.com", "comprehend.amazonaws.com", "kendra.amazonaws.com" ] } } } ] }

    Para obtener más información, consulteCrear políticas de IAMyAdición y eliminación de permisos de identidad de IAM.

  • LaAWSLista de servicios regionales. Para reducir la latencia, debe elegir laAWSregión más cercana a su ubicación geográfica que admite Amazon Comprehend y Amazon Kendra.

  • (Opcional) UnAWS Key Management Service. Aunque este tutorial no utiliza cifrado, es posible que desee utilizar las prácticas recomendadas de cifrado para su caso de uso específico.

  • (Opcional) UnAmazon Virtual Private Cloud. Aunque este tutorial no utiliza una VPC, es posible que desee utilizar las prácticas recomendadas de la VPC para garantizar la seguridad de los datos para su caso de uso específico.