Amazon WorkDocs - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Amazon WorkDocs

Amazon WorkDocs es un servicio de colaboración de contenido seguro para crear, editar, almacenar y compartir contenido. Puede usarlo Amazon Kendra para indexar su fuente Amazon WorkDocs de datos.

Puede conectarse Amazon Kendra a su fuente Amazon WorkDocs de datos mediante la Amazon Kendra consola y la WorkDocsConfigurationAPI.

Amazon WorkDocs está disponible en las regiones de Oregón, Virginia del Norte, Sídney, Singapur e Irlanda.

Para solucionar problemas del conector de la fuente de Amazon Kendra WorkDocs datos, consulteSolución de problemas con los orígenes de datos.

Características admitidas

Amazon Kendra WorkDocs el conector de fuente de datos admite las siguientes funciones:

  • Asignaciones de campo

  • control de acceso de usuarios

  • Filtros de inclusión/exclusión

  • Registro de cambios

Requisitos previos

Antes de poder utilizarla Amazon Kendra para indexar la fuente de WorkDocs datos, realice estos cambios en sus AWS cuentas WorkDocs y.

En WorkDocs, asegúrate de tener:

  • Apuntó el ID de Amazon WorkDocs directorio (ID de organización) de su Amazon WorkDocs repositorio.

  • Comprobó que cada documento es único en WorkDocs y entre las demás fuentes de datos que planea usar para el mismo índice. Cada origen de datos que desee utilizar para un índice no debe contener el mismo documento en varios orígenes de datos. Los ID de documento son globales para un índice y deben ser únicos por índice.

En su AWS cuenta, asegúrese de tener:

Si no tiene un IAM rol existente, puede usar la consola para crear un nuevo IAM rol cuando conecte su fuente de WorkDocs datos a Amazon Kendra. Si utiliza la API, debe proporcionar el ARN de un IAM rol existente y un ID de índice.

Instrucciones de conexión

Para conectarse Amazon Kendra a su fuente de WorkDocs datos, debe proporcionar los detalles necesarios de la fuente de WorkDocs datos para que Amazon Kendra pueda acceder a sus datos. Si aún no lo ha configurado WorkDocs Amazon Kendra, consulteRequisitos previos.

Console

Para conectarse Amazon Kendra a Amazon WorkDocs

  1. Inicie sesión en la Amazon Kendra consola AWS Management Console y ábrala.

  2. En el panel de navegación izquierdo, elija Índices y, a continuación, elija el índice que desee usar de la lista de índices.

    nota

    Puede elegir configurar o editar los ajustes de Control de acceso de usuarios en la Configuración del índice.

  3. En la página Introducción, seleccione Agregar origen de datos.

  4. En la página Agregar fuente de datos, elija el WorkDocs conector y, a continuación, elija Agregar conector. Si utiliza la versión 2 (si corresponde), elija el WorkDocs conector con la etiqueta «V2.0".

  5. En la página Especificar detalles del origen de datos, introduzca la siguiente información:

    1. En Nombre y descripción, en Nombre del origen de datos: introduzca un nombre para el origen de datos. Puede incluir guiones, pero no espacios.

    2. (Opcional) Descripción: introduzca una descripción opcional para el origen de datos.

    3. En el idioma predeterminado: elija un idioma para filtrar los documentos para el índice. A menos que especifique lo contrario, el idioma predeterminado es el inglés. El idioma especificado en los metadatos del documento anula el idioma seleccionado.

    4. En Etiquetas, para añadir una nueva etiqueta: incluya etiquetas opcionales para buscar y filtrar sus recursos o realizar un seguimiento de sus AWS costes.

    5. Elija Siguiente.

  6. En la página Definir acceso y seguridad, introduzca la siguiente información:

    1. ID de organización específico de su Amazon WorkDocs sitio: seleccione el ID del Amazon WorkDocs sitio que desea indexar. Ya debe haber creado un sitio.

    2. IAM rol: elige un IAM rol existente o crea uno nuevo IAM para acceder a las credenciales del repositorio y al contenido del índice.

      nota

      IAM los roles utilizados para los índices no se pueden usar para las fuentes de datos. Si no está seguro de si un rol existente se utiliza para un índice o para las preguntas frecuentes, elija Crear un nuevo rol para evitar errores.

    3. Elija Siguiente.

  7. En la página Configurar ajustes de sincronización, introduzca la siguiente información:

    1. Rastrear los comentarios de los documentos: las entidades Amazon WorkDocs o los tipos de contenido que quiere rastrear.

    2. Utilizar registros de cambios: seleccione esta opción para actualizar el índice solo con contenido nuevo o modificado en lugar de sincronizar todos los archivos.

    3. Patrones regex: patrones de expresiones regulares para incluir o excluir determinados archivos.

    4. Calendario de ejecución sincronizado para la frecuencia: elija la frecuencia con la que desea sincronizar el contenido de la fuente de datos y actualizar el índice.

    5. Elija Siguiente.

  8. En la página Establecer asignaciones de campos, especifique la siguiente información:

    1. Campos de fuente de datos predeterminados: seleccione entre los campos de fuente de datos predeterminados Amazon Kendra generados que desee asignar a su índice.

    2. Agregar campo: para agregar campos de origen de datos personalizados para crear un nombre de campo de índice al que asignarlos y el tipo de datos del campo.

    3. Elija Siguiente.

  9. En la página Revisar y crear, compruebe que la información que ha introducido es correcta y, a continuación, seleccione Añadir origen de datos. También puede elegir editar la información desde esta página. El origen de datos aparecerá en la página Orígenes de datos una vez que el origen de datos se haya agregado correctamente.

API

Para conectarse a Amazon Kendra Amazon WorkDocs

Debe especificar lo siguiente mediante la WorkDocsConfigurationAPI:

  • Amazon WorkDocs ID de directorio: especifique el ID de organización de su Amazon WorkDocs directorio. Puede encontrar el ID de la organización en el AWS Directory Service yendo a Activar directorio y luego a Directorios.

  • Función de IAM: especifique RoleArn cuándo llama CreateDataSource para proporcionar una IAM función con permisos para acceder al WorkDocs directorio y para llamar a las API públicas necesarias para el conector y. WorkDocs Amazon Kendra Para obtener más información, consulte Funciones de IAM para las fuentes de datos. WorkDocs

También puede añadir las siguientes características opcionales:

  • Registro de cambios: si se Amazon Kendra debe utilizar el mecanismo de registro de cambios de la fuente de WorkDocs datos para determinar si un documento debe actualizarse en el índice.

    nota

    Utilice el registro de cambios si no quiere que Amazon Kendra digitalice todos los documentos. Si el registro de cambios es grande, es posible que se Amazon Kendra tarde menos en digitalizar los documentos de la fuente de WorkDocs datos que en procesar el registro de cambios. Si sincroniza la fuente de WorkDocs datos con el índice por primera vez, se digitalizarán todos los documentos.

  • Filtros de inclusión y exclusión: especifique si desea incluir o excluir determinados documentos y comentarios de documentos. Cada comentario se indexa como un documento independiente.

    nota

    La mayoría de los orígenes de datos utilizan patrones de expresiones regulares, que son patrones de inclusión o exclusión denominados filtros. Si especifica un filtro de inclusión, solo se indexará el contenido que coincida con el filtro de inclusión. Los documentos que no coincidan con el filtro de inclusión no se indexan. Si especifica un filtro de inclusión y exclusión, los documentos que coincidan con el filtro de exclusión no se indexarán, aunque coincidan con el filtro de inclusión.

  • Filtrado por contexto de usuario y control de acceso:Amazon Kendra rastrea la lista de control de acceso (ACL) de sus documentos, si tiene una ACL para ellos. La información de la ACL se utiliza para filtrar los resultados de búsqueda en función del acceso del usuario o su grupo a los documentos. Para obtener más información, consulte Filtrado de contexto de usuario.

  • Asignaciones de campos: elija asignar los campos de la fuente de WorkDocs datos a los campos de índice. Amazon Kendra Para obtener más información, consulte Asignación de campos de origen de datos.

    nota

    El campo del cuerpo del documento o el cuerpo del documento equivalente de sus documentos es obligatorio Amazon Kendra para poder buscarlos. Debe asignar el nombre del campo del cuerpo del documento en la fuente de datos al nombre del campo de índice_document_body. Todos los demás campos son opcionales.

Más información

Para obtener más información sobre la integración Amazon Kendra con la fuente de WorkDocs datos, consulte: