本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
连接 Confluence 获取你的 Amazon Bedrock 知识库
注意
Confluence 数据源连接器处于预览版,可能会发生变化。
Atlassian Confluence 是一款协作式工作管理工具,专为共享、存储和处理项目规划、软件开发和产品管理而设计。您可以使用适用于亚马逊 Bedrock 的AWS 管理控制台或 API CreateDataSource(参见 Amazon Bedrock 支持的软件开发工具包和),连接到 Confluence 实例以
Amazon Bedrock 支持连接到 Confluence 云实例。目前,只有 Amazon OpenSearch Serverless 矢量存储可用于此数据源。
支持的特征
-
自动检测主要文档字段
-
包含/排除内容过滤器
-
对已添加、更新、删除的内容进行增量内容同步
-
OAuth 2.0 身份验证、Confluence API 令牌
先决条件
在 Confluence 中,请确保您:
-
记下你的 Confluence 实例网址。
例如,对于 Confluence Cloud,https://example.atlassian.net。
Confluence Cloud 的网址必须是基本网址,以.atlassian.net 结尾。
-
配置包含用户名(管理员账户的电子邮件地址)和密码(Confluence API 令牌)的基本身份验证凭证,以允许 Amazon Bedrock 连接到您的 Confluence Cloud 实例。有关如何创建 Confluence API 令牌的信息,请参阅 Atlassian 网站上的管理您的 Atlassian 账户的 API 令牌
。 -
(可选)使用应用程序密钥、应用程序密钥、访问令牌和刷新令牌等凭据配置 OAuth 2.0 应用程序。有关更多信息,请参阅 Atlassian 网站上的 OAuth 2.0 应用程序
。 -
创建 OAuth 2.0 应用程序时,需要某些读取权限或范围才能连接到 Confluence。
Confluence API:
-
离线访问
-
只读:content.attachment: Confluence
-
阅读:confluence-content.all
-
阅读:confluence-content.summ
-
阅读:合流空间。摘要
-
在您的 AWS 账户中,请确保:
-
将您的身份验证凭证存储在AWS Secrets Manager 密钥中,如果使用 API,请记下该密钥的 Amazon 资源名称 (ARN)。按照此页面上的 Connection 配置说明添加密钥中必须包含的键值对。
-
在知识库的 AWS Identity and Access Management (IAM) 角色/权限策略中包含连接数据源的必要权限。有关将此数据源添加到知识库 IAM 角色所需的权限的信息,请参阅访问数据源的权限。
注意
如果您使用控制台,则可以 AWS Secrets Manager 前往添加您的密钥或选择现有密钥作为数据源配置步骤的一部分。作为创建知识库的控制台步骤的一部分,可以为您创建具有所有所需权限的 IAM 角色。配置数据源和其他配置后,具有所有必需权限的 IAM 角色将应用于您的特定知识库。
我们建议您定期刷新或轮换您的凭证和密码。为了安全起见,请仅提供必要的访问权限级别。我们不建议您跨数据源重复使用凭证和机密。
连接配置
要连接到您的 Confluence 实例,您必须提供必要的配置信息,以便 Amazon Bedrock 可以访问和抓取您的数据。您还必须遵循先决条件 .
本节包含此数据源的配置示例。
有关自动检测文档字段、包含/排除筛选器、增量同步、秘密身份验证凭据及其工作原理的更多信息,请选择以下选项:
数据源连接器会自动检测并抓取文档或内容的所有主要元数据字段。例如,数据源连接器可以抓取与您的文档等效的文档正文、文档标题、文档创建或修改日期或其他可能适用于您的文档的核心字段。
重要
如果您的内容包含敏感信息,则 Amazon Bedrock 可以使用敏感信息进行响应。
您可以包含或排除对某些内容的抓取。例如,您可以指定排除前缀/正则表达式模式,以跳过对文件名中包含 “private” 的任何文件的抓取。您也可以指定包含前缀/正则表达式模式以包含某些内容实体或内容类型。如果您指定了 “包含” 和 “排除” 筛选器,并且两者都与文档匹配,则排除过滤器优先,并且不会对文档进行抓取。
您可以对以下内容类型应用包含/排除过滤器:
-
Space
: 唯一的空格键 -
Page
: 主页标题 -
Blog
: 主博客标题 -
Comment
: 评论标题 -
Attachment
: 附件文件名及其扩展名
每次您的数据源与知识库同步时,数据源连接器都会抓取新内容、修改内容和已删除内容。 Amazon Bedrock 可以使用数据源的机制来跟踪内容更改并抓取自上次同步以来更改的内容。首次将数据源与知识库同步时,默认情况下会抓取所有内容。
要将您的数据源与知识库同步,请使用 StartIngestionJobAPI 或在控制台中选择您的知识库,然后在数据源概述部分中选择同步。
重要
您从数据源同步的所有数据都可供bedrock:Retrieve
有权检索数据的任何人使用。这也可以包括任何具有受控数据源权限的数据。有关更多信息,请参阅知识库权限。
(如果使用基本身份验证)您的秘密身份验证凭据 AWS Secrets Manager 应包含以下键值对:
-
username
:Atlassian 账户的管理员用户电子邮件地址
-
password
:Confluence API 令牌
(如果使用 OAuth 2.0 身份验证)您的秘密身份验证凭据 AWS Secrets Manager 应包含以下键值对:
-
confluenceAppKey
:应用程序密钥
-
confluenceAppSecret
:应用密钥
-
confluenceAccessToken
:应用程序访问令牌
-
confluenceRefreshToken
:应用程序刷新令牌
注意
Confluence OAuth2.0 访问令牌的默认到期时间为 60 分钟。如果此令牌在您的数据源同步(同步任务)时过期,Amazon Bedrock 将使用提供的刷新令牌来重新生成此令牌。此重新生成会刷新访问令牌和刷新令牌。为了将令牌从当前同步任务更新到下一个同步任务,Amazon Bedrock 要求您的秘密证书具有写入/放置权限,这是您的知识库 IAM 角色的一部分。
注意
您的密钥 AWS Secrets Manager 必须使用知识库的相同区域。