OneDrive Conector Microsoft V1.0 - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

OneDrive Conector Microsoft V1.0

Microsoft OneDrive es un servicio de almacenamiento basado en la nube que puedes usar para almacenar, compartir y alojar tu contenido. Se puede utilizar Amazon Kendra para indexar la fuente de OneDrive datos de Microsoft.

nota

Está previsto que el soporte para el OneDrive conector V1.0 y la OneDrive API de Microsoft finalice en junio de 2023. Recomendamos utilizar el OneDrive conector V2.0/API. TemplateConfiguration

Para solucionar problemas del conector de la fuente de Amazon Kendra OneDrive datos, consulteSolución de problemas con los orígenes de datos.

Características admitidas

  • Asignaciones de campo

  • Filtros de inclusión/exclusión

Requisitos previos

Antes de poder utilizarla Amazon Kendra para indexar la fuente de OneDrive datos, realice estos cambios en sus AWS cuentas OneDrive y.

En Azure Active Directory (AD), asegúrese de que:

  • Ha creado una aplicación de Azure Active Directory (AD).

  • Ha utilizado el ID de la aplicación de AD para registrar una clave secreta para la aplicación en el sitio de AD. La clave secreta debe contener el ID de la aplicación y una clave secreta.

  • Ha copiado el dominio de AD de la organización.

  • Se agregaron los siguientes permisos de aplicación a su aplicación de AD en la opción Microsoft Graph:

    • Leer los archivos de todas las colecciones de sitios (File.Read-All)

    • Leer el perfil completo de todos los usuarios (User.Read.All)

    • Leer los datos del directorio (Directory.Read.All)

    • Leer todos los grupos (Group.Read.All)

    • Leer los elementos de todas las colecciones de sitios (Site.Read.All)

  • Ha copiado la lista de usuarios cuyos documentos se deben indexar. Puede elegir entre proporcionar una lista de nombres de usuario o puede proporcionarlos en un archivo almacenado en un Amazon S3. Después de crear el origen de datos, puede:

    • Modificar la lista de usuarios.

    • Cambia de una lista de usuarios a una lista almacenada en un Amazon S3 bucket.

    • Cambia la ubicación del Amazon S3 depósito de una lista de usuarios. Si cambias la ubicación del depósito, también debes actualizar el IAM rol de la fuente de datos para que tenga acceso al depósito.

      nota

      Si almacena la lista de nombres de usuario en un Amazon S3 depósito, la IAM política de la fuente de datos debe proporcionar acceso al depósito y acceso a la clave con la que se cifró el depósito, si la hubiera.

  • Marcó que cada documento es único en OneDrive las demás fuentes de datos que vaya a utilizar para el mismo índice y entre ellas. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. Los ID de documento son globales para un índice y deben ser únicos por índice.

En el suyo Cuenta de AWS, asegúrese de tener:

  • Creó un Amazon Kendra índice y, si usa la API, anotó el ID del índice.

  • Creó un IAM rol para su fuente de datos y, si usa la API, anotó el ARN del IAM rol.

    nota

    Si cambias el tipo de autenticación y las credenciales, debes actualizar tu IAM rol para acceder al ID AWS Secrets Manager secreto correcto.

  • Guardó sus credenciales de OneDrive autenticación en un AWS Secrets Manager secreto y, si usa la API, anotó el ARN del secreto.

    nota

    Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. No se recomienda volver a utilizar las credenciales y los datos secretos en varios orígenes de datos ni en las versiones 1.0 y 2.0 del conector (si procede).

Si no tiene un IAM rol o secreto existente, puede usar la consola para crear un nuevo IAM rol y un Secrets Manager secreto al conectar su fuente de OneDrive datos. Amazon Kendra Si utiliza la API, debe proporcionar el ARN de un IAM rol y un Secrets Manager secreto existentes y un ID de índice.

Instrucciones de conexión

Para conectarse Amazon Kendra a su fuente de OneDrive datos, debe proporcionar los detalles de sus OneDrive credenciales para que Amazon Kendra pueda acceder a sus datos. Si aún no lo ha configurado OneDrive , Amazon Kendra consulteRequisitos previos.

Console

Para conectarse Amazon Kendra a OneDrive

  1. Inicie sesión en la Amazon Kendra consola AWS Management Console y ábrala.

  2. En el panel de navegación izquierdo, elija Índices y, a continuación, elija el índice que desee usar de la lista de índices.

    nota

    Puede elegir configurar o editar los ajustes de Control de acceso de usuarios en la Configuración del índice.

  3. En la página Introducción, seleccione Agregar origen de datos.

  4. En la página Agregar fuente de datos, elija el OneDrive conector y, a continuación, elija Agregar conector. Si utiliza la versión 2 (si corresponde), elija el OneDrive conector con la etiqueta «V2.0".

  5. En la página Especificar detalles del origen de datos, introduzca la siguiente información:

    1. En Nombre y descripción, en Nombre del origen de datos: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

    2. (Opcional) Descripción: introduzca una descripción opcional para el origen de datos.

    3. En el idioma predeterminado: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

    4. En Etiquetas, para añadir una nueva etiqueta: incluya etiquetas opcionales para buscar y filtrar sus recursos o realizar un seguimiento de sus AWS costes.

    5. Elija Siguiente.

  6. En la página Definir acceso y seguridad, introduzca la siguiente información:

    1. OneDrive ID de inquilino: introduzca el ID de OneDrive inquilino sin el protocolo.

    2. En Tipo de autenticación: elija entre Nuevo y Existente.

      1. Si elige Existente, seleccione un secreto existente en Seleccionar secreto.

      2. Si elige Nuevo, introduzca la siguiente información en la sección Nuevo secreto de AWS Secrets Manager :

        1. Nombre del secreto: un nombre para su secreto. El prefijo 'AmazonKendra- OneDrive -' se añade automáticamente a su nombre secreto.

        2. Para el identificador de la aplicación y la contraseña de la aplicación: introduzca los valores de las credenciales de autenticación de su OneDrive cuenta y, a continuación, seleccione Guardar autenticación.

    3. IAM rol: elija un IAM rol existente o cree uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.

      nota

      IAM los roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija Crear un nuevo rol para evitar errores.

    4. Elija Siguiente.

  7. En la página Configurar ajustes de sincronización, introduzca la siguiente información:

    1. Elija entre Archivo de lista y Lista de nombres según el caso de uso.

      1. Si elige Archivo de lista, introduzca la siguiente información:

        1. Seleccionar ubicación: introduzca la ruta a su bucket de Amazon S3 .

          Añadir el archivo de lista de usuarios a Amazon S3: seleccione esta opción para añadir los archivos de la lista de usuarios al bucket Amazon S3 .

          Asignaciones de grupos locales de usuarios: seleccione esta opción para utilizar la asignación de grupos locales para filtrar el contenido.

      2. Si elige Lista de nombres, introduzca la siguiente información:

        1. Nombre de usuario: introduzca hasta 10 unidades de usuario para indexarlas. Para añadir más de 10 usuarios, cree un archivo que contenga los nombres.

          Añadir otro: elija esta opción para añadir más usuarios.

          Asignaciones de grupos locales de usuarios: seleccione esta opción para utilizar la asignación de grupos locales para filtrar el contenido.

    2. En Configuración adicional: añada patrones de expresión regular para incluir o excluir determinados archivos. Puede agregar hasta 100 patrones.

    3. En Sincronizar el programa de ejecución, para Frecuencia: elija la frecuencia con la Amazon Kendra que se sincronizará con su fuente de datos.

    4. Elija Siguiente.

  8. En la página Establecer asignaciones de campos, especifique la siguiente información:

    1. Para los campos de fuente de datos predeterminados y otras asignaciones de campos sugeridas: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice.

    2. Elija Siguiente.

  9. En la página Revisar y crear, compruebe que la información que ha introducido es correcta y, a continuación, seleccione Añadir origen de datos. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página Orígenes de datos una vez que el origen de datos se haya agregado correctamente.

API

Para conectarse a Amazon Kendra OneDrive

Debe especificar lo siguiente mediante la OneDriveConfigurationAPI:

  • ID de inquilino: especifique el dominio de Azure Active Directory de la organización.

  • OneDrive Usuarios: especifique la lista de cuentas de usuario cuyos documentos deben indexarse.

  • Nombre secreto de recurso de Amazon (ARN): proporcione el nombre de recurso de Amazon (ARN) de un Secrets Manager secreto que contenga las credenciales de autenticación de su cuenta. OneDrive El secreto se almacena en una estructura JSON con las siguientes claves:

    { "username": "OAuth client ID", "password": "client secret" }
  • IAM rol: especifique RoleArn cuándo llama CreateDataSource para proporcionar un IAM rol con permisos para acceder a su Secrets Manager secreto y para llamar a las API públicas requeridas para el conector y. OneDrive Amazon Kendra Para obtener más información, consulte las IAM funciones de las fuentes OneDrive de datos.

También puede añadir las siguientes características opcionales:

  • Filtros de inclusión y exclusión: especifique si desea incluir o excluir determinados documentos.

    nota

    La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.

  • Asignaciones de campos: elija asignar los campos de la fuente de OneDrive datos a los campos de índice. Amazon Kendra Para obtener más información, consulte Asignación de campos de origen de datos.

    nota

    El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en la fuente de datos al nombre del campo de índice_document_body. Todos los demás campos son opcionales.

  • Filtrado por contexto de usuario y control de acceso:Amazon Kendra rastrea la lista de control de acceso (ACL) de sus documentos, si tiene una ACL para ellos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte Filtrado de contexto de usuario.