翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon Bedrock ナレッジベース SharePoint を Microsoft に接続する
注記
Microsoft SharePoint データソースコネクタはプレビューリリースであり、変更される可能性があります。
Microsoft SharePoint は、ドキュメント、ウェブページ、ウェブサイト、リストなどを扱うためのウェブベースの共同サービスです。Amazon Bedrock の AWS マネジメントコンソールまたは API を使用して、Amazon Bedrock
Amazon Bedrock は、 SharePoint オンラインインスタンスへの接続をサポートしています。 OneNote ドキュメントのクローリングは現在サポートされていません。現在、このデータソースで使用できるのは Amazon OpenSearch Serverless ベクトルストアのみです。
サポートされている機能
-
メインドキュメントフィールドの自動検出
-
包含/除外コンテンツフィルター
-
追加、更新、削除されたコンテンツの増分コンテンツ同期
-
OAuth 2.0 認証
前提条件
で SharePoint、以下を確認してください。
-
SharePoint オンラインサイトの URL/URLs。例えば、
https://yourdomain.sharepoint.com/sites/mysite
などです。URL はhttps
で始まり、sharepoint.com
が含まれている必要があります。サイト URL は、sharepoint.com/
や SharePoint sites/mysite/home.aspx ではなく、実際のサイトである必要があります。
-
SharePoint オンラインインスタンス URL/URLs。
-
(OAuth 2.0 認証の場合) Microsoft 365 テナント ID をコピーします。テナント ID は、Azure Active Directory ポータルのプロパティまたは OAuth アプリケーションで確認できます。
管理者 SharePoint アカウントのユーザー名とパスワードを書き留め、アプリケーションを登録するときにクライアント ID とクライアントシークレット値をコピーします。
注記
アプリケーションの例については、Microsoft Learn ウェブサイトの「Microsoft Entra ID (旧 Azure Active Directory) にクライアントアプリケーションを登録する
」を参照してください。 -
アプリケーションを登録する SharePoint ときに に接続するには、特定の読み取りアクセス許可が必要です。
-
SharePoint: AllSites.Read (委任) – すべてのサイトコレクションの項目を読み取る
-
-
管理者ユーザーを使用して、Azure ポータルのセキュリティデフォルトをオフにする必要がある場合があります。Azure Portal でのセキュリティのデフォルト設定の管理の詳細については、セキュリティのデフォルトを有効または無効にする方法に関する Microsoft のドキュメント
を参照してください。 -
Amazon Bedrock が SharePoint コンテンツのクロールをブロックされないように、 SharePoint アカウントで多要素認証 (MFA) をオフにする必要がある場合があります。
AWS アカウントで、以下を確認してください。
-
認証情報を AWS Secrets Manager シークレットに保存し、 API を使用する場合は、シークレットの Amazon リソースネーム (ARN) を書き留めます。このページの接続設定手順に従って、シークレットに含める必要があるキーと値のペアを含めます。
-
ナレッジベースの AWS Identity and Access Management (IAM) ロール/アクセス許可ポリシーに、データソースに接続するために必要なアクセス許可を含めます。このデータソースがナレッジベース IAM ロールに追加するために必要なアクセス許可については、「データソースへのアクセス許可」を参照してください。
注記
コンソールを使用する場合は、 AWS Secrets Manager に移動してシークレットを追加したり、データソース設定ステップの一部として既存のシークレットを選択したりできます。ナレッジベースを作成するためのコンソールステップの一部として、必要なアクセス許可を持つ IAM ロールを作成できます。データソースやその他の設定を行うと、必要なアクセス許可を持つ IAM ロールが特定のナレッジベースに適用されます。
認証情報とシークレットは、定期的に更新またはローテーションすることをお勧めします。セキュリティに必要なアクセスレベルのみを提供してください。データソース間で認証情報とシークレットを再利用することはお勧めしません。
接続設定
SharePoint インスタンスに接続するには、Amazon Bedrock がデータにアクセスしてクロールできるように、必要な設定情報を提供する必要があります。また、 に従う必要があります前提条件。
このセクションには、このデータソースの設定例が含まれています。
ドキュメントフィールドの自動検出、包含/除外フィルター、増分同期、シークレット認証情報、およびこれらの仕組みの詳細については、以下を選択してください。
データソースコネクタは、ドキュメントまたはコンテンツのすべての主要なメタデータフィールドを自動的に検出してクロールします。例えば、データソースコネクタは、ドキュメントに相当するドキュメント本文、ドキュメントタイトル、ドキュメントの作成日または変更日、またはドキュメントに適用される可能性のあるその他のコアフィールドをクロールできます。
重要
コンテンツに機密情報が含まれている場合、 Amazon Bedrock は機密情報を使用して応答できます。
特定のコンテンツのクロールを含めたり除外したりできます。例えば、除外プレフィックス/正規表現パターンを指定して、ファイル名に「プライベート」が含まれているファイルのクロールをスキップできます。また、包含プレフィックス/正規表現パターンを指定して、特定のコンテンツエンティティまたはコンテンツタイプを含めることもできます。包含フィルターと除外フィルターを指定し、両方がドキュメントと一致する場合、除外フィルターが優先され、ドキュメントはクロールされません。
包含/除外フィルターは、次のコンテンツタイプに適用できます。
-
Page
: メインページのタイトル -
Event
: イベント名 -
File
: 添付ファイルとすべてのドキュメントファイルの拡張子が付いたファイル名
OneNote ドキュメントのクローリングは現在サポートされていません。
データソースコネクタは、データソースがナレッジベースと同期するたびに、新規、変更、削除されたコンテンツをクロールします。 Amazon Bedrock は、データソースのメカニズムを使用して、コンテンツの変更を追跡し、前回の同期以降に変更されたコンテンツをクロールできます。データソースをナレッジベースと初めて同期すると、デフォルトですべてのコンテンツがクロールされます。
データソースをナレッジベースと同期するには、 StartIngestionJob API を使用するか、コンソールでナレッジベースを選択し、データソースの概要セクションで Sync を選択します。
重要
データソースから同期するすべてのデータは、データを取得するbedrock:Retrieve
権限を持つすべてのユーザーが利用できるようになります。これには、データソースのアクセス許可が制御されているすべてのデータを含めることもできます。詳細については、「ナレッジベースのアクセス許可」を参照してください。
(OAuth 2.0 認証の場合) のシークレット認証情報には、次のキーと値のペアを含める AWS Secrets Manager 必要があります。
-
username
:SharePoint 管理者ユーザー名
-
password
:SharePoint 管理者パスワード
-
clientId
:アプリケーションクライアント ID
-
clientSecret
:アプリケーションクライアントのシークレット
注記
のシークレット AWS Secrets Manager は、ナレッジベースの同じリージョンを使用する必要があります。