Uso de un origen de datos de Atlassian Confluence - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de un origen de datos de Atlassian Confluence

Puede utilizar Atlassian Confluence como fuente de datos paraAmazon Kendra. Para usar Confluence en la consola de, vaya a laAmazon Kendraconsola, selecciona tu índice y, a continuación, seleccionaOrígenes de datosdesde el menú de navegación para añadir Confluence.

Amazon Kendraadmite la nube de Atlassian Confluence y la instancia de servidor de Atlassian Confluence.

Cuando se conecta a Confluence para indexar los documentos, especifica la URL de la instancia de Confluence. Puede especificar patrones de expresiones regulares para incluir o excluir publicaciones de blog, páginas, espacios o adjuntos específicos en su Confluence.Amazon Kendraindexa blogs, páginas y espacios regulares de forma predeterminada. Si elige indexar adjuntos, solo se indexan los adjuntos de las páginas y blogs indexados.

Debe crear un índice antes de crear el origen de datos de Confluence. Para obtener más información, consulteCreación de un índice. Proporciona el ID del índice al crear el origen de datos.

Para conectarse a Confluence, especifique la conexión y otra información en la consola o mediante elConfluenceConfigurationobjeto. Proporciona la URL de la instancia de Confluence que desee indexar.

Para poder indexar su contenido desde su Confluence, debe crear una cuenta con permisos administrativos. La cuenta debe concederAmazon Kendrapermiso para ver todo el contenido de la instancia de Confluence. Puede otorgar estos permisos a la cuenta convirtiéndola en miembro delconfluence-administratorsgrupo. Debe especificar la versión de Confluence que utiliza al configurar Confluence, ya sea que utilice la nube de Confluence o el servidor de Confluence.

También debe proporcionar el nombre de recurso de Amazon (ARN) de unIAMque conceda permiso a para obtener acceso a suAWS Secrets Managersecret, que almacena sus credenciales de autenticación de Confluence y elAWS Key Management Servicese utiliza para descifrarlo. Proporciona el ARN de unIAMrol mediante laCreateDataSourceAPI. Para obtener más información acerca de los permisos, consulte.IAMroles para fuentes de datos de Atlassian Confluence.

Amazon Kendrarequiere credenciales de autenticación para acceder a Confluence. Almacena tus credenciales de Confluence en unAWS Secrets Managersecreto de. Las credenciales son el nombre de usuario y la contraseña de su cuenta de Confluence. Si usas la nube de Confluence, utilizas un token de API generado como contraseña. Para obtener más información, consulteTokens APIen el sitio web de Atlassian. Si utiliza laAmazon Kendraconsola para crear el origen de datos, puede crear el secreto mientras crea el origen de datos. O bien, puede usar unSecrets Managersecreto de. Si utiliza la API para crear su origen de datos, deberá proporcionar el nombre de recurso de Amazon (ARN) de un secreto existente.

Las credenciales se almacenan como una cadena JSON en elSecrets Managersecreto de.

{ "username": "user-name", "password": "password or API token" }

Amazon Kendratambién rastrea la información de usuario de la instancia de Confluence. Esto resulta útil para el filtrado de contexto de usuario, donde los resultados de búsqueda se filtran en función del acceso del usuario o de su grupo a los documentos. Para obtener más información, consulteFiltrado de contexto de usuario para fuentes de datos de Confluence.

También puede agregar la siguiente información opcional:

  • Patrón de inclusión o exclusión: Si especifica un patrón de inclusión, ningún documento con un nombre de archivo o tipo de archivo que no coincida con el patrón no se indexará. Si especifica un patrón de inclusión y exclusión, los documentos que coinciden con el patrón de exclusión no se indexan incluso si coinciden con el patrón de inclusión.

  • Asignaciones de campos de página que asignan los campos de Confluence aAmazon Kendracampos de índice. Para obtener más información, consulteAsignación de campos de origen de datos.

Indexación de espacios

Amazon Kendraincluye información de un espacio del índice. Se puede incluir un espacio en los resultados de una consulta basada en esta información. La cuenta de Confluence utilizada para el origen de datos debe tener permiso para acceder al espacio para indexarlo.

Por defecto,Amazon Kendrano indexa el archivo y los espacios personales de Confluence. Puede elegir indexarlas cuando cree el origen de datos. Si no quiereAmazon Kendrapara indexar un espacio, marcarlo en privado en Confluence.

Puede restringir el acceso al contenido de un espacio especificando permisos de vista. Si una consulta incluye información de usuario,Amazon Kendralee estos permisos y los utiliza para filtrar el contexto del usuario. Para obtener más información, consulte Filtrado en contexto de usuario.

Si utiliza elAmazon Kendraconsola para crear un origen de datos de Confluence,Amazon Kendracrea campos de índice para usted cuando especifica una asignación de campos. Si utiliza la API, primero debe crear el campo de índice mediante laUpdateIndexAPI. Para asignar los campos de Confluence aAmazon Kendra. Consulte la tabla siguiente.

campo de confluence proveedor de sugerenciasAmazon Kendracampo
DISPLAY_URL _source_uri
ITEM_TYPE _categoría
SPACE_KEY cf_space_key
URL cf_url

Páginas de indexación

Amazon Kendraindexa todas las páginas, incluidas las páginas anidadas, en un espacio, a menos que se filtren por un patrón de inclusión o exclusión.

Para indexar páginas, debe utilizar una cuenta de Confluence que tenga acceso a las páginas. El acceso a las páginas de Confluence puede realizarse mediante permisos de grupo anidados. Para acceder a una página, debe pertenecer al grupo o subgrupo que tiene permiso para acceder a la página. Si una consulta incluye información de usuario,Amazon Kendralee estos permisos y los utiliza para filtrar el contexto del usuario. Para obtener más información, consulte Filtrado en contexto de usuario.

Si utiliza la consola para crear un origen de datos de Confluence,Amazon Kendracrea los campos de índice para usted cuando especifica una asignación de campos. Si utiliza la API, primero debe crear el campo de índice mediante laUpdateIndexAPI. Para asignar los campos de Confluence aAmazon Kendra. Consulte la tabla siguiente.

campo de confluence proveedor de sugerenciasAmazon Kendracampo
AUTOR cf_author
CONTENT_STATUS cf_page_content_status
CREATED_DATE _created_at
DISPLAY_URL _source_uri
ITEM_TYPE _categoría
LABELS cf_labels
MODIFIED_DATE _last_updated_at
PARENT_ID cf_parent_id
SPACE_KEY cf_space_key
SPACE_NAME cf_space_name
URL cf_url
VERSION cf_version

Blogs

Amazon Kendraindexa todos los blogs de un espacio a menos que se filtren de la indexación mediante un patrón de inclusión o exclusión.

Para indexar blogs, debe utilizar una cuenta de Confluence que tenga acceso a los blogs y a los espacios que los contienen. El acceso a los blogs en Confluence puede realizarse mediante permisos de grupo anidados. Para acceder a un blog, debes pertenecer al grupo o subgrupo que tiene permiso para acceder al blog y a su espacio. Si una consulta incluye información de usuario,Amazon Kendralee estos permisos y los utiliza para filtrar el contexto del usuario. Para obtener más información, consulte Filtrado en contexto de usuario.

Si utiliza la consola para indexar un origen de datos de Confluence,Amazon Kendracrea los campos de índice para usted cuando especifica una asignación de campos. Si utiliza la API, primero debe crear el campo de índice mediante laUpdateIndexAPI. Para asignar los campos de origen de datos de Confluence aAmazon Kendra. Consulte la tabla siguiente.

campo de confluence proveedor de sugerenciasAmazon Kendracampo
AUTOR cf_author
DISPLAY_URL _source_uri
ITEM_TYPE _categoría
LABELS cf_labels
PUBLISH_DATE _created_at
SPACE_KEY cf_space_key
SPACE_NAME cf_space_name
URL cf_url
VERSION cf_version

Archivos adjuntos

Confluence le permite crear archivos adjuntos a páginas y publicaciones de blog. De forma predeterminada, los adjuntos no se indexan. Puede configurarAmazon Kendrapara incluir adjuntos en el índice.Amazon Kendraincluye solo adjuntos a páginas y blogs indexados del índice.

Amazon Kendraindexa solo los siguientes tipos de documentos admitidos:

  • Microsoft Word

  • Microsoft PowerPoint

  • HTML

  • PDF

  • Texto no cifrado

Para indexar adjuntos, debe utilizar una cuenta de Confluence que tenga acceso a los blogs o páginas de los adjuntos y a sus espacios. El acceso a los blogs en Confluence puede realizarse mediante permisos de grupo anidados. Para obtener acceso a un,debe pertenecer al grupo o subgrupo que tiene permiso para acceder a los blogs o páginas de los archivos adjuntos y a sus espacios. Si una consulta incluye información de usuario,Amazon Kendralee estos permisos y los utiliza para filtrar el contexto del usuario. Para obtener más información, consulte Filtrado en contexto de usuario.

Si utiliza la consola de,Amazon Kendracrea campos de índice para usted cuando especifica una asignación de campos. Si utiliza la API, primero debe crear el campo de índice mediante laUpdateIndexAPI. Para asignar los campos de Confluence aAmazon Kendra, consulte la tabla siguiente.

campo de confluence proveedor de sugerenciasAmazon Kendracampo
AUTOR cf_author
CONTENT_TYPE cf_attachment_content_type
CREATED_DATE _created_at
DISPLAY_URL _source_uri
FILE_SIZE cf_attachment_file_size
ITEM_TYPE _categoría
LABELS cf_labels
PARENT_ID cf_parent_id
SPACE_KEY cf_space_key
SPACE_NAME cf_space_name
URL cf_url
VERSION cf_version