Amazon RDS/Aurora - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Amazon RDS/Aurora

Puede indexar los documentos que están almacenados en una base de datos mediante un origen de datos de base de datos. Después de proporcionar la información de conexión a la base de datos, Amazon Kendra conecta e indexa los documentos.

Amazon Kendra admite las siguientes bases de datos:

  • Amazon Aurora MySQL

  • Amazon Aurora PostgreSQL

  • Amazon RDS para MySQL

  • Amazon RDS para PostgreSQL

nota

No se admiten las bases de datos Aurora sin servidor.

importante

Está previsto que este conector Amazon RDS/Aurora deje de estar disponible a finales de 2023.

Amazon Kendra ahora admite nuevos conectores de fuentes de datos de bases de datos. Para mejorar la experiencia, le recomendamos que elija uno de los siguientes nuevos conectores para su caso de uso:

Puede conectarse Amazon Kendra a la fuente de datos de su base de datos mediante la Amazon Kendra consola y la DatabaseConfigurationAPI.

Para solucionar problemas del conector de fuentes Amazon Kendra de datos de su base de datos, consulteSolución de problemas con los orígenes de datos.

Características admitidas

Amazon Kendra el conector de fuente de datos de base de datos admite las siguientes funciones:

  • Asignaciones de campo

  • Filtrado de contexto de usuario

  • Nube privada virtual (VPC)

Requisitos previos

Antes de poder usarlo Amazon Kendra para indexar la fuente de datos de la base de datos, realice estos cambios en la base de datos y en AWS las cuentas.

En la base de datos, asegúrese de que:

  • Ha apuntado las credenciales de autenticación básica del nombre de usuario y la contraseña de la base de datos.

  • Ha copiado el nombre de host, el número de puerto, la dirección de host, el nombre de la base de datos y el nombre de la tabla de datos que contiene los datos del documento. En el caso de PostgreSQL, la tabla de datos debe ser una tabla pública o un esquema público.

    nota

    El host y el puerto indican Amazon Kendra dónde encontrar el servidor de base de datos en Internet. El nombre de la base de datos y el nombre de la tabla indican Amazon Kendra dónde encontrar los datos del documento en el servidor de la base de datos.

  • Ha copiado los nombres de las columnas de la tabla de datos que contienen los datos del documento. Debe incluir el ID del documento, el cuerpo del documento, las columnas para detectar si un documento ha cambiado (por ejemplo, la columna actualizada por última vez) y las columnas opcionales de la tabla de datos que se asignan a campos de índice personalizados. También puede asignar cualquiera de los nombres de campo reservados de Amazon Kendra a una columna de la tabla.

  • Se ha copiado la información del tipo de motor de base de datos, por ejemplo, si se utiliza Amazon RDS para MySQL u otro tipo.

  • Ha comprobado que cada documento es único en la base de datos y en otros orígenes de datos que vaya a utilizar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. Los ID de documento son globales para un índice y deben ser únicos por índice.

En tu Cuenta de AWS, asegúrate de tener:

  • Creó un Amazon Kendra índice y, si usa la API, anotó el ID del índice.

  • Creó un IAM rol para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.

    nota

    Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.

  • Ha guardado sus credenciales de autenticación de la base de datos en un secreto de AWS Secrets Manager y, si utiliza la API, ha anotado el ARN del secreto.

    nota

    Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. No se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar la fuente de datos de la base de datos Amazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

Instrucciones de conexión

Para conectarse Amazon Kendra a la fuente de datos de la base de datos, debe proporcionar los detalles necesarios de la fuente de datos de la base de datos para Amazon Kendra poder acceder a los datos. Si aún no ha configurado la base de datos para Amazon Kendra, consulteRequisitos previos.

Console

Para conectarse Amazon Kendra a una base de datos

  1. Inicie sesión en la Amazon Kendra consola AWS Management Console y ábrala.

  2. En el panel de navegación izquierdo, elija Índices y, a continuación, elija el índice que desee usar de la lista de índices.

    nota

    Puede elegir configurar o editar los ajustes de Control de acceso de usuarios en la Configuración del índice.

  3. En la página Introducción, seleccione Agregar origen de datos.

  4. En la página Agregar fuente de datos, elija el conector de base de datos y, a continuación, elija Agregar conector. Si utiliza la versión 2 (si corresponde), elija el conector de base de datos con la etiqueta «V2.0".

  5. En la página Especificar detalles del origen de datos, introduzca la siguiente información:

    1. En Nombre y descripción, en Nombre del origen de datos: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

    2. (Opcional) Descripción: introduzca una descripción opcional para el origen de datos.

    3. En el idioma predeterminado: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

    4. En Etiquetas, para añadir una nueva etiqueta: incluya etiquetas opcionales para buscar y filtrar sus recursos o realizar un seguimiento de sus AWS costes.

    5. Elija Siguiente.

  6. En la página Definir acceso y seguridad, introduzca la siguiente información:

    1. Punto de conexión: un nombre de host DNS, una dirección IPv4 o una dirección IPv6.

    2. Puerto: un número de puerto.

    3. Base de datos: nombre de la base de datos.

    4. Nombre de tabla: nombre de la tabla.

    5. En Tipo de autenticación, elija entre Existente y Nuevo para almacenar las credenciales de autenticación de la base de datos. Si decide crear un secreto nuevo, se abrirá una ventana de secreto de AWS Secrets Manager .

      1. Introduzca la siguiente información en la ventana Crear un secreto de AWS Secrets Manager :

        1. Nombre del secreto: un nombre para su secreto. El prefijo «AmazonKendra-database-» se añade automáticamente a tu nombre secreto.

        2. En Nombre de usuario y Contraseña: introduzca los valores de las credenciales de autenticación de su cuenta de base de datos.

        3. Seleccione Guardar autenticación.

    6. Nube privada virtual (VPC): puede optar por utilizar una VPC. Si es así, debe agregar Subredes y Grupos de seguridad de VPC.

      nota

      Debe utilizar una subred privada. Si la instancia de RDS está en una subred pública en la VPC, puede crear una subred privada que tenga acceso saliente a una puerta de enlace NAT en la subred pública. Las subredes proporcionadas en la configuración de VPC deben estar en Oeste de EE. UU. (Oregón), Este de EE. UU. (Norte de Virginia), Europa (Irlanda).

    7. IAM rol: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.

      nota

      IAM los roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija Crear un nuevo rol para evitar errores.

    8. Elija Siguiente.

  7. En la página Configurar ajustes de sincronización, introduzca la siguiente información:

    1. Seleccione entre Aurora MySQL, MySQL, Aurora PostgreSQL y PostgreSQL según el caso de uso.

    2. Incluir los identificadores SQL entre comillas dobles: seleccione esta opción para incluir los identificadores SQL entre comillas dobles. Por ejemplo, “columnName”.

    3. Columna ACL y columnas de detección de cambios: configure las columnas que se Amazon Kendra utilizan para la detección de cambios (por ejemplo, la columna actualizada por última vez) y su lista de control de acceso.

    4. En el programa de ejecución sincronizado, para Frecuencia: elija la frecuencia con la que Amazon Kendra se sincronizará con la fuente de datos.

    5. Elija Siguiente.

  8. En la página Establecer asignaciones de campos, especifique la siguiente información:

    1. Amazon Kendra asignaciones de campos predeterminadas: seleccione entre las fuentes de datos predeterminadas Amazon Kendra generadas los campos que desee asignar a su índice. Debe agregar los valores de la Columna de base de datos para document_id y document_body

    2. Asignaciones de campo personalizado: para agregar campos de origen de datos personalizados a fin de crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

    3. Elija Siguiente.

  9. En la página Revisar y crear, compruebe que la información que ha introducido es correcta y, a continuación, seleccione Añadir origen de datos. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página Orígenes de datos una vez que el origen de datos se haya agregado correctamente.

API

Para conectarse Amazon Kendra a una base de datos

Debe especificar la siguiente DatabaseConfigurationAPI:

  • ColumnConfiguration—Información sobre dónde debe obtener el índice la información del documento de la base de datos. Para obtener más información, consulte ColumnConfiguration. Debe especificar los campos DocumentDataColumnName (cuerpo del documento o texto principal), DocumentIdColumnName y ChangeDetectingColumn (por ejemplo, la columna actualizada por última vez). La columna asignada al campo DocumentIdColumnName debe ser una columna de números enteros. En el siguiente ejemplo se muestra una configuración simple de columnas para un origen de datos de base de datos:

    "ColumnConfiguration": { "ChangeDetectingColumns": [ "LastUpdateDate", "LastUpdateTime" ], "DocumentDataColumnName": "TextColumn", "DocumentIdColumnName": "IdentifierColumn", "DocoumentTitleColumnName": "TitleColumn", "FieldMappings": [ { "DataSourceFieldName": "AbstractColumn", "IndexFieldName": "Abstract" } ] }
  • ConnectionConfiguration—Información de configuración necesaria para conectarse a una base de datos. Para obtener más información, consulte ConnectionConfiguration.

  • DatabaseEngineType—El tipo de motor de base de datos que ejecuta la base de datos. El DatabaseHost campo ConnectionConfiguration debe ser el punto final Amazon Relational Database Service (Amazon RDS) de la instancia de la base de datos. No utilice el punto de conexión del clúster.

  • Nombre secreto de recurso de Amazon (ARN): proporcione el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de su cuenta de base de datos. El secreto se almacena en una estructura JSON con las siguientes claves:

    { "username": "user name", "password": "password" }

    En el siguiente ejemplo se muestra una configuración de base de datos que incluye el ARN secreto.

    "DatabaseConfiguration": { "ConnectionConfiguration": { "DatabaseHost": "host.subdomain.domain.tld", "DatabaseName": "DocumentDatabase", "DatabasePort": 3306, "SecretArn": "arn:aws:secretmanager:region:account ID:secret/secret name", "TableName": "DocumentTable" } }
    nota

    Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. No se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

  • IAM rol: especifique RoleArn cuándo llama CreateDataSource para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar a las API públicas requeridas para el conector de base de datos y. Amazon Kendra Para obtener más información, consulte Roles de IAM para orígenes de datos de base de datos.

También puede añadir las siguientes características opcionales:

  • Nube privada virtual (VPC): especifique VpcConfiguration como parte de la configuración del origen de datos. Consulte Configuración de Amazon Kendra para utilizar una VPC.

    nota

    Debe utilizar solo una subred privada. Si la instancia de RDS está en una subred pública en la VPC, puede crear una subred privada que tenga acceso saliente a una puerta de enlace NAT en la subred pública. Las subredes proporcionadas en la configuración de VPC deben estar en Oeste de EE. UU. (Oregón), Este de EE. UU. (Norte de Virginia), Europa (Irlanda).

  • Asignaciones de campos: elija asignar los campos del origen de datos de base de datos a los campos de índice de Amazon Kendra . Para obtener más información, consulte Asignación de campos de origen de datos.

    nota

    El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en la fuente de datos al nombre del campo de índice_document_body. Todos los demás campos son opcionales.

  • Filtrado por contexto de usuario y control de acceso:Amazon Kendra rastrea la lista de control de acceso (ACL) de sus documentos, si tiene una ACL para ellos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte Filtrado de contexto de usuario.