本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Connect 到 Microsoft 以 SharePoint 獲取您的 Amazon 基岩知識庫
Microsoft SharePoint 是一種協作式的基於 Web 的服務,用於處理文檔,網頁,網站,列表等。您可以使用 Amazon 基岩知識庫連接到您的 SharePoint 執行個體 AWS 適用於 Amazon 基岩
注意
Microsoft SharePoint 資料來源連接器正在預覽版本中,且可能會變更。
Amazon 基岩支援連 SharePoint 線到線上執行個體。目前不支援探索 OneNote 文件。目前,只有 Amazon OpenSearch 無伺服器向量存放區可與此資料來源搭配使用。
每個檔案可以編目的檔案數量和 MB 有限制。如需知識庫,請參閱配額。
支援的功能
-
自動偵測主要文件欄位
-
包含/排除內容過濾器
-
增量內容同步新增、更新、刪除的內容
-
OAuth身份驗證
必要條件
在中 SharePoint,請確定您:
-
注意您的 SharePoint 在線網站URL/URLs。例如
https://yourdomain.sharepoint.com/sites/mysite
。 您URL必須從https
並包含sharepoint.com
。 您的網站URL必須是實際的 SharePoint 網站,而不是sharepoint.com/
或sites/mysite/home.aspx
-
記下您的 SharePoint 在線實例URL/的域名URLs。
-
(適用於 OAuth 2.0 驗證) 複製您的 Microsoft 365 租用戶識別碼。您可以在 Azure 作用中目錄入口網站的內容或應用程式中找到您的租OAuth用戶識別碼。
記下管理員 SharePoint 帳戶的使用者名稱和密碼,並在註冊應用程式時複製用戶端 ID 和用戶端密碼值。
注意
如需應用程式範例,請參閱註冊用戶端應用程式中的 Microsoft 項目識別碼
(以前稱為 Azure 作用中目錄) Microsoft 學習網站上。 -
註冊應用程式 SharePoint 時,需要特定的讀取權限才能連線到。
-
SharePoint: AllSites .Read (委派) — 讀取所有網站集合中的項目
-
-
您可能需要使用系統管理員使用者關閉 Azure 入口網站中的安全性預設值。如需在 Azure 入口網站中管理安全性預設設定的詳細資訊,請參閱 Microsoft 說明文件,瞭解如何啟用/停用安全性預
設 -
您可能需要關閉 SharePoint 帳戶中的多因素身份驗證 (MFA),這樣 Amazon Bdrock 才不會對您的內容進行檢索。 SharePoint
在您的 AWS 帳戶,請確保您:
-
將您的身份驗證憑據存儲在 AWS Secrets Manager 秘密並注意 Amazon 資源名稱(ARN)的秘密。請遵循此頁面上的「連線」組態指示,納入密碼中必須包含的索引鍵值配對。
-
包括必要的權限以連接到您的數據源 AWS Identity and Access Management (IAM)您的知識庫的角色/權限策略。如需此資料來源新增至知識庫所需權限的相關資訊 IAM 角色,請參閱存取資料來源的權限。
注意
如果您使用控制台,則可以轉到 AWS Secrets Manager 以新增密碼或使用現有密碼做為資料來源組態步驟的一部分。所以此 IAM 可以為您建立具有所有必要權限的角色,作為建立知識庫的主控台步驟的一部分。設定資料來源和其他設定之後, IAM 具有所有必需權限的角色會套用至您的特定知識庫。
我們建議您定期重新整理或輪換您的認證和密碼。僅為您自己的安全提供必要的訪問級別。我們不建議您跨資料來源重複使用認證和密碼。
連接配置
若要連線到 SharePoint 執行個體,您必須提供必要的組態資訊,以便 Amazon Bedrock 可以存取和抓取您的資料。您還必須遵循必要條件.
此資料來源的組態範例包含在本節中。
如需 auto 偵測文件欄位、包含/排除篩選器、增量同步、秘密驗證認證,以及這些欄位如何運作的詳細資訊,請選取下列選項:
資料來源連接器會自動偵測並編目文件或內容的所有主要中繼資料欄位。例如,資料來源連接器可以編目對等於文件的文件內文、文件標題、文件建立或修改日期,或其他可能套用至文件的核心欄位。
重要
如果您的內容包含敏感資訊,則 Amazon Bedrock 可以使用敏感信息進行響應。
您可以將篩選運算子套用至中繼資料欄位,以協助您進一步改善回應的相關性。例如,文件「epoch_modification_time」或在 1970 年 1 月 1 日當文件最後更新時所傳遞的秒數。您可以過濾最新的數據,其中「時代 _ 修改時間」大於某個數字。如需有關可套用至中繼資料欄位之篩選運算子的詳細資訊,請參閱中繼資料和篩選。
您可以包含或排除探索特定內容。例如,您可以指定排除前綴/規則運算式模式,以略過檢索檔案名稱中包含「private」的任何檔案。您也可以指定包含首碼/規則運算式模式,以包含某些內容實體或內容類型。如果您指定包含和排除篩選器,且兩者都符合文件,則排除篩選器會優先執行,而且不會編目文件。
一個正則表達式模式的例子,用於排除或過濾掉PDF文件名中包含「private」的文件:」。 * 私人 .*\\ .pdf」
您可以在下列內容類型上套用包含/排除篩選器:
-
Page
:主頁標題 -
Event
: 活動名稱 -
File
:附件和所有文檔文件的擴展名的文件名
目前不支援探索 OneNote 文件。
每次資料來源與您的知識庫同步時,資料來源連接器都會檢索新的、已修改的和已刪除的內容。 Amazon Bedrock 可以使用資料來源的機制來追蹤自上次同步以來變更的內容和編目內容。當您第一次將資料來源與知識庫同步時,依預設會檢索所有內容。
若要將資料來源與知識庫同步,請在主控台中使用StartIngestionJobAPI或選取您的知識庫,然後在資料來源概觀區段中選取 [同步]。
重要
您從資料來源同步的所有資料都可供具有擷取資料bedrock:Retrieve
權限的任何人使用。這也可以包括任何具有受控資料來源權限的資料。如需詳細資訊,請參閱知識庫權限。
(用於 OAuth 2.0 身份驗證)您的秘密身份驗證憑據 AWS Secrets Manager 應該包括這些鍵值對:
-
username
:SharePoint admin username
-
password
:SharePoint admin password
-
clientId
:app client ID
-
clientSecret
:app client secret
注意
你的秘密 AWS Secrets Manager 必須使用知識庫的相同區域。