連接至您知識庫的 Confluence

Atlassian Confluence 是一種協作工作管理工具，旨在共用、儲存和處理專案規劃、軟體開發和產品管理。您可以使用 Amazon Bedrock AWS 的管理主控台或 CreateDataSource API （請參閱 Amazon Bedrock 支援的 SDKs和 AWS CLI) 來連線至 Amazon Bedrock 知識庫的 Confluence 執行個體。 CreateDataSource

注意

Confluence 資料來源連接器處於預覽版本，可能會有所變更。

Confluence 資料來源不支援多模式資料，例如資料表、圖表、圖表或其他影像。

Amazon Bedrock 支援連線至 Confluence Cloud 執行個體。目前，只有 Amazon OpenSearch Serverless 向量存放區可用於此資料來源。

每個檔案可以抓取的檔案和 MB 數量有所限制。如需知識庫，請參閱配額。

支援的功能

自動偵測主要文件欄位
包含/排除內容篩選條件
新增、更新、刪除內容的增量內容同步
OAuth 2.0 身分驗證，使用 Confluence API 字符進行身分驗證

先決條件

在 Confluence 中，請確定您：

請記下您的 Confluence 執行個體 URL。例如，對於 Confluence Cloud，https：//https://example.atlassian.net。Confluence Cloud 的 URL 必須是基本 URL，以 .atlassian.net 結尾。
設定包含使用者名稱（管理員帳戶的電子郵件）和密碼 (Confluence API 字符）的基本身分驗證憑證，以允許 Amazon Bedrock 連線至 Confluence Cloud 執行個體。如需有關如何建立 Confluence API 權杖的資訊，請參閱 Atlassian 網站上的管理 Atlassian 帳戶的 API 權杖。
（選用）使用應用程式金鑰、應用程式秘密、存取字符和重新整理字符的登入資料來設定 OAuth 2.0 應用程式。如需詳細資訊，請參閱 Atlassian 網站上的 OAuth 2.0 應用程式。
必須啟用特定讀取許可或範圍，OAuth 2.0 應用程式才能連線至 Confluence。

Confluence API：
- offline_access
- read：content：confluence – 檢視詳細內容
- read：content-details：confluence – 檢視內容詳細資訊
- read：space-details：confluence – 檢視空間詳細資訊
- read：audit-log：confluence – 檢視稽核記錄
- read：page：confluence – 檢視頁面
- read：attachment：confluence – 檢視和下載內容附件
- read：blogpost：confluence – 檢視部落格文章
- read：custom-content：confluence – 檢視自訂內容
- read：comment：confluence – 檢視評論
- read：template：confluence – 檢視內容範本
- read：label：confluence – 檢視標籤
- read：watcher：confluence – 檢視內容監看器
- read：relation：confluence – 檢視實體關係
- read：user：confluence – 檢視使用者詳細資訊
- read：configuration：confluence – 檢視 Confluence 設定
- read：space：confluence – 檢視空間詳細資訊
- read：space.property：confluence – 檢視空間屬性
- read：user.property：confluence – 檢視使用者屬性
- read：space.setting：confluence – 檢視空間設定
- read：analytics.content：confluence – 檢視內容的分析
- read：content.property：confluence – 檢視內容屬性
- read：content.metadata：confluence – 檢視內容摘要
- read：inlinetask：confluence – 檢視任務
- read：task：confluence – 檢視任務
- read：whiteboard：confluence – 檢視白板
- read：app-data：confluence – 讀取應用程式資料
- read：folder：confluence - 檢視資料夾
- read：embed：confluence - 檢視 Smart Link 資料

在您的帳戶中 AWS ，請確定您：

將您的身分驗證憑證存放在AWS Secrets Manager 秘密中，並記下秘密的 Amazon Resource Name (ARN)。遵循此頁面上的連線組態指示，以包含必須包含在您的秘密中的鍵/值對。
在知識庫的 AWS Identity and Access Management (IAM) 角色/許可政策中包含連接到資料來源的必要許可。如需此資料來源新增至知識庫 IAM 角色的必要許可資訊，請參閱存取資料來源的許可。

注意

如果您使用主控台，您可以前往 AWS Secrets Manager 新增秘密，或使用現有的秘密做為資料來源組態步驟的一部分。您可以在建立知識庫的主控台步驟中，為您建立具有所有必要許可 IAM 的角色。在您設定資料來源和其他組態之後，具有所有必要許可 IAM 的角色會套用至您的特定知識庫。

我們建議您定期重新整理或輪換您的登入資料和秘密。僅為您自己的安全提供必要的存取層級。不建議您在資料來源之間重複使用登入資料和秘密。

連線組態

若要連線至 Confluence 執行個體，您必須提供必要的組態資訊，Amazon Bedrock 才能存取和編目您的資料。您也必須遵循先決條件。

本節包含此資料來源的組態範例。

如需文件欄位的自動偵測、包含/排除篩選條件、增量同步、秘密身分驗證憑證，以及這些運作方式的詳細資訊，請選取下列各項：

資料來源連接器會自動偵測和編目文件或內容的所有主要中繼資料欄位。例如，資料來源連接器可以編目與您文件同等的文件內文、文件標題、文件建立或修改日期，或其他可能適用於您文件的核心欄位。

重要

如果您的內容包含敏感資訊，則 Amazon Bedrock 可能會使用敏感資訊來回應。

您可以將篩選運算子套用至中繼資料欄位，以協助您進一步改善回應的相關性。例如，文件 "epoch_modification_time" 或文件上次更新時間的 1970 年 1 月 1 日經過的秒數。您可以篩選最近的資料，其中 "epoch_modification_time" 大於特定數字。如需可套用至中繼資料欄位之篩選運算子的詳細資訊，請參閱中繼資料和篩選。

您可以包含或排除編目特定內容。例如，您可以指定排除字首/規則表達式模式，略過編目檔案名稱中包含「私有」的任何檔案。您也可以指定包含字首/規則表達式模式，以包含特定內容實體或內容類型。如果您指定包含和排除篩選條件，且兩者都符合文件，則排除篩選條件優先，且文件不會被編目。

規則表達式模式的範例，用於排除或篩選檔案名稱中包含「私有」的 PDF 檔案：「.*private.*\\.pdf」

您可以在下列內容類型上套用包含/排除篩選條件：

Space：唯一空格鍵
Page：主頁面標題
Blog：主要部落格標題
Comment：屬於特定頁面或部落格的評論。指定重新：頁面/部落格標題
Attachment：附件檔案名稱及其副檔名

每次資料來源與知識庫同步時，資料來源連接器都會編目新的、修改和刪除的內容。 Amazon Bedrock 可以使用資料來源的機制來追蹤自上次同步以來變更的內容和編目內容。當您第一次將資料來源與知識庫同步時，預設會爬取所有內容。

若要將資料來源與知識庫同步，請使用 StartIngestionJob API，或在主控台中選取知識庫，然後在資料來源概觀區段中選取同步。

重要

您從資料來源同步的所有資料可供具有擷取資料bedrock:Retrieve許可的任何人使用。這也可以包含具有控制資料來源許可的任何資料。如需詳細資訊，請參閱知識庫許可。

（如果使用基本身分驗證）您在中的秘密身分驗證憑證 AWS Secrets Manager 應包含這些鍵/值對：

username：Atlassian 帳戶的管理員使用者電子郵件地址
password：Confluence API 字符

（如果使用 OAuth 2.0 身分驗證）您在中的秘密身分驗證憑證 AWS Secrets Manager 應包含這些鍵/值對：

confluenceAppKey：應用程式金鑰
confluenceAppSecret：應用程式秘密
confluenceAccessToken：應用程式存取字符
confluenceRefreshToken：應用程式重新整理字符

注意

Confluence OAuth2.0 存取權杖的預設到期時間為 60 分鐘。如果此字符在您的資料來源同步時過期（同步任務），Amazon Bedrock 將使用提供的重新整理字符來重新產生此字符。此重新產生會同時重新整理存取權杖和重新整理權杖。為了讓字符從目前同步任務更新到下一個同步任務，Amazon Bedrock 需要秘密憑證的寫入/輸出許可，作為知識庫 IAM 角色的一部分。

注意

您在中的秘密 AWS Secrets Manager 必須使用與知識庫相同的區域。

Console

將 Confluence 執行個體連接至您的知識庫

遵循中的步驟透過連線至 Amazon Bedrock 知識庫中的資料來源來建立知識庫，然後選擇 Confluence 作為資料來源。
提供資料來源的名稱和選用描述。
提供您的 Confluence 執行個體 URL。例如，對於 Confluence Cloud，https：//https://example.atlassian.net。Confluence Cloud 的 URL 必須是基本 URL，以 .atlassian.net 結尾。
在進階設定區段中，您可以選擇設定下列項目：
- 用於暫時性資料儲存的 KMS 金鑰。– 您可以使用預設 AWS 受管金鑰或您自己的 KMS 金鑰，在將資料轉換為內嵌時加密暫時性資料。如需詳細資訊，請參閱資料擷取期間的暫時性資料儲存加密。
- 資料刪除政策 – 您可以刪除預設存放在向量存放區中之資料來源的向量內嵌，或選擇保留向量存放區資料。
提供身分驗證資訊以連線至 Confluence 執行個體：
- 如需基本身分驗證，請前往 AWS Secrets Manager 新增秘密身分驗證憑證，或為您建立的秘密使用現有的 Amazon Resource Name (ARN)。您的秘密必須包含 Atlassian 帳戶的管理員使用者電子郵件地址做為使用者名稱，並包含 Confluence API 字符來取代密碼。如需有關如何建立 Confluence API 權杖的資訊，請參閱 Atlassian 網站上的管理 Atlassian 帳戶的 API 權杖。
- 對於 OAuth 2.0 身分驗證，請前往 AWS Secrets Manager 新增秘密身分驗證憑證，或為您建立的秘密使用現有的 Amazon Resource Name (ARN)。您的秘密必須包含 Confluence 應用程式金鑰、應用程式秘密、存取字符和重新整理字符。如需詳細資訊，請參閱 Atlassian 網站上的 OAuth 2.0 應用程式。
（選用）在內容剖析和區塊化區段中，您可以自訂如何剖析和區塊化資料。請參閱下列資源，進一步了解這些自訂項目：
- 如需剖析選項的詳細資訊，請參閱資料來源的剖析選項。
- 如需區塊策略的詳細資訊，請參閱內容區塊如何適用於知識庫。
  
  警告
  連線到資料來源後，您無法變更區塊策略。
- 如需如何使用 Lambda 函數自訂資料區塊和處理中繼資料的詳細資訊，請參閱使用自訂轉換 Lambda 函數來定義如何擷取您的資料。
選擇使用篩選條件/規則表達式模式來包含或排除特定內容。否則會爬取所有標準內容。
繼續選擇內嵌模型和向量存放區。若要查看剩餘的步驟，請在連接資料來源後返回透過連線至 Amazon Bedrock 知識庫中的資料來源來建立知識庫並從步驟繼續。

API

以下是 Amazon Bedrock 知識庫連線至 Confluence Cloud 的組態範例。您可以使用 API 搭配 AWS CLI 或支援的 SDK 來設定資料來源，例如 Python。呼叫 CreateKnowledgeBase 之後，您可以呼叫 CreateDataSource，在中使用連線資訊建立資料來源dataSourceConfiguration。

若要了解您可以透過包含選用vectorIngestionConfiguration欄位套用至擷取的自訂，請參閱自訂資料來源的擷取。

AWS Command Line Interface


aws bedrock create-data-source \
 --name "Confluence Cloud/SaaS connector" \
 --description "Confluence Cloud/SaaS data source connector for Amazon Bedrock to use content in Confluence" \
 --knowledge-base-id "your-knowledge-base-id" \
 --data-source-configuration file://confluence-bedrock-connector-configuration.json \
 --data-deletion-policy "DELETE" \
 --vector-ingestion-configuration '{"chunkingConfiguration":[{"chunkingStrategy":"FIXED_SIZE","fixedSizeChunkingConfiguration":[{"maxTokens":"100","overlapPercentage":"10"}]}]}'

confluence-bedrock-connector-configuration.json
{
    "confluenceConfiguration": {
        "sourceConfiguration": {
            "hostUrl": "https://example.atlassian.net",
            "hostType": "SAAS",
            "authType": "OAUTH2_CLIENT_CREDENTIALS",
            "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-Confluence"
        },
        "crawlerConfiguration": {
            "filterConfiguration": {
                "type": "PATTERN",
                "patternObjectFilter": {
                    "filters": [
                        {
                            "objectType": "Attachment",
                            "inclusionFilters": [
                                ".*\\.pdf"
                            ],
                            "exclusionFilters": [
                                ".*private.*\\.pdf"
                            ]
                        }
                    ]
                }
            }
        }
    },
    "type": "CONFLUENCE"
}

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

Amazon S3

Microsoft SharePoint

連接至您知識庫的 Confluence

注意

主題

支援的功能

先決條件

注意

連線組態

重要

重要

注意

注意

將 Confluence 執行個體連接至您的知識庫

警告