Connect zu Microsoft her, SharePoint um Ihre Amazon Bedrock-Wissensdatenbank zu erhalten - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Connect zu Microsoft her, SharePoint um Ihre Amazon Bedrock-Wissensdatenbank zu erhalten

Microsoft SharePoint ist ein kollaborativer webbasierter Dienst für die Arbeit an Dokumenten, Webseiten, Websites, Listen und mehr. Sie können eine Verbindung zu Ihrer SharePoint Instance für Ihre Amazon Bedrock-Wissensdatenbank herstellen, indem Sie entweder die AWS Management Console für Amazon Bedrock oder die CreateDataSourceAPI(siehe Amazon Bedrock unterstützt SDKs und) verwenden. AWS CLI

Anmerkung

Amazon Bedrock unterstützt die Verbindung zu SharePoint Online-Instances. Das Crawlen von OneNote Dokumenten wird derzeit nicht unterstützt. Derzeit ist nur Amazon OpenSearch Serverless Vector Store für die Verwendung mit dieser Datenquelle verfügbar.

Es gibt Beschränkungen für die Anzahl der Dateien und MB pro Datei, die gecrawlt werden können. Informationen zu Wissensdatenbanken finden Sie unter Kontingente.

Unterstützte Features

  • Automatische Erkennung der wichtigsten Dokumentfelder

  • Inhaltsfilter zum Einschließen/Ausschließen

  • Inkrementelle Inhaltssynchronisierung für hinzugefügte, aktualisierte und gelöschte Inhalte

  • OAuth2.0-Authentifizierung und reine SharePoint App-Authentifizierung

Voraussetzungen

Stellen SharePoint Sie für die OAuth 2.0-Authentifizierung sicher, dass Sie:

  • Notieren Sie sich Ihre SharePoint Online-SiteURL/URLs. Beispiel, https://yourdomain.sharepoint.com/sites/mysite. Sie URL müssen mit beginnen https und enthaltensharepoint.com. Ihre Site URL muss die tatsächliche SharePoint Site sein, nicht sharepoint.com/ oder sites/mysite/home.aspx

  • Notieren Sie sich den Domainnamen Ihrer SharePoint Online-InstanzURL/URLs.

  • Kopieren Sie Ihre Microsoft 365-Mandanten-ID. Sie finden Ihre Mandanten-ID in den Eigenschaften Ihres Microsoft Entra-Portals oder in Ihrer OAuth Anwendung.

    Notieren Sie sich den Benutzernamen und das Passwort des SharePoint Administratorkontos und kopieren Sie bei der Registrierung einer Anwendung die Client-ID und den geheimen Client-Wert.

    Anmerkung

    Eine Beispielanwendung finden Sie unter Registrieren einer Client-Anwendung in Microsoft Entra ID (früher bekannt als Azure Active Directory) auf der Microsoft Learn-Website.

  • SharePoint Bei der Registrierung einer Anwendung sind bestimmte Leseberechtigungen erforderlich, um eine Verbindung herzustellen.

    • SharePoint: AllSites .Read (delegiert) — Elemente in allen Websitesammlungen lesen

  • Möglicherweise müssen Sie die Sicherheitsstandards in Ihrem Azure-Portal mithilfe eines Administratorbenutzers deaktivieren. Weitere Informationen zur Verwaltung von Sicherheitsstandardeinstellungen im Azure-Portal finden Sie in der Microsoft-Dokumentation zum Aktivieren/Deaktivieren von Sicherheitsstandards.

  • Möglicherweise müssen Sie die Multi-Faktor-Authentifizierung (MFA) in Ihrem SharePoint Konto deaktivieren, damit Amazon Bedrock nicht daran gehindert wird, Ihre Inhalte zu crawlen. SharePoint

Stellen Sie bei der Authentifizierung SharePoint nur über Apps sicher SharePoint, dass Sie:

  • Kopieren Sie Ihre Microsoft 365-Mandanten-ID. Sie finden Ihre Mandanten-ID in den Eigenschaften Ihres Microsoft Entra-Portals oder in Ihrer OAuth Anwendung.

  • Konfigurieren Sie Anmeldeinformationen, die nur für Sharepoint Apps bestimmt sind.

  • Kopieren Sie die Client-ID und den Wert für den geheimen Client-Schlüssel, wenn Sie App-Only die SharePoint Berechtigung erteilen. Weitere Informationen finden Sie unter Zugriff mit SharePoint App-Only gewähren.

    Anmerkung

    Sie müssen keine API Berechtigungen für SharePoint App-Only einrichten.

Stellen Sie in Ihrem AWS Konto sicher, dass Sie:

  • Speichern Sie Ihre Authentifizierungsdaten AWS Secrets Manager geheim und notieren Sie sich den Amazon-Ressourcennamen (ARN) des Geheimnisses. Folgen Sie den Anweisungen zur Verbindungskonfiguration auf dieser Seite, um die Schlüssel-Wert-Paare aufzunehmen, die in Ihrem Geheimnis enthalten sein müssen.

  • Nehmen Sie die erforderlichen Berechtigungen für die Verbindung mit Ihrer Datenquelle in Ihre AWS Identity and Access Management (IAM) Rollen-/Berechtigungsrichtlinie für Ihre Wissensdatenbank auf. Informationen zu den erforderlichen Berechtigungen für diese Datenquelle, um sie Ihrer IAM Wissensdatenbank-Rolle hinzuzufügen, finden Sie unter Berechtigungen für den Zugriff auf Datenquellen.

Anmerkung

Wenn Sie die Konsole verwenden, können Sie Ihr Geheimnis AWS Secrets Manager hinzufügen oder ein vorhandenes Geheimnis als Teil des Konfigurationsschritts für die Datenquelle verwenden. Die IAM Rolle mit allen erforderlichen Berechtigungen kann im Rahmen der Konsolenschritte zum Erstellen einer Wissensdatenbank für Sie erstellt werden. Nachdem Sie Ihre Datenquelle und andere Konfigurationen konfiguriert haben, wird die IAM Rolle mit allen erforderlichen Berechtigungen auf Ihre spezifische Wissensdatenbank angewendet.

Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihr Geheimnis regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten in verschiedenen Datenquellen wiederzuverwenden.

Konfiguration der Verbindung

Um eine Verbindung zu Ihrer SharePoint Instance herzustellen, müssen Sie die erforderlichen Konfigurationsinformationen angeben, damit Amazon Bedrock auf Ihre Daten zugreifen und sie crawlen kann. Sie müssen auch dem folgen. Voraussetzungen

Ein Beispiel für eine Konfiguration für diese Datenquelle ist in diesem Abschnitt enthalten.

Weitere Informationen zur auto Erkennung von Dokumentfeldern, Ein-/Ausschlussfiltern, inkrementeller Synchronisierung, geheimen Authentifizierungsdaten und deren Funktionsweise finden Sie unter folgenden Optionen:

Der Datenquellen-Connector erkennt und crawlt automatisch alle wichtigen Metadatenfelder Ihrer Dokumente oder Inhalte. Der Datenquellen-Connector kann beispielsweise den Dokumenttext durchsuchen, der Ihren Dokumenten entspricht, den Dokumenttitel, das Erstellungs- oder Änderungsdatum des Dokuments oder andere Kernfelder, die möglicherweise auf Ihre Dokumente zutreffen.

Wichtig

Wenn Ihr Inhalt vertrauliche Informationen enthält, Amazon Bedrock könnten Sie mit vertraulichen Informationen antworten.

Sie können Filteroperatoren auf Metadatenfelder anwenden, um die Relevanz von Antworten weiter zu verbessern. Zum Beispiel das Dokument „epoch_modification_time“ oder die Anzahl der Sekunden, die seit dem 1. Januar 1970 vergangen sind, als das Dokument zuletzt aktualisiert wurde. Sie können nach den neuesten Daten filtern, wobei „epoch_modification_time“ größer als eine bestimmte Zahl ist. Weitere Informationen zu den Filteroperatoren, die Sie auf Ihre Metadatenfelder anwenden können, finden Sie unter Metadaten und Filterung.

Sie können das Crawlen bestimmter Inhalte ein- oder ausschließen. Sie können beispielsweise ein prefix/regular expression pattern to skip crawling any file that contains “private” in the file name. You could also specify an inclusion prefix/regular Ausschlussausdrucksmuster angeben, um bestimmte Inhaltsentitäten oder Inhaltstypen einzubeziehen. Wenn Sie einen Inklusions- und Ausschlussfilter angeben und beide einem Dokument entsprechen, hat der Ausschlussfilter Vorrang und das Dokument wird nicht gecrawlt.

Ein Beispiel für ein Muster mit regulären Ausdrücken zum Ausschließen oder Herausfiltern von PDF Dateien, die „privat“ im Dateinamen enthalten:“. *private.*\\ .pdf

Sie können Einschluss-/Ausschlussfilter auf die folgenden Inhaltstypen anwenden:

  • Page: Titel der Hauptseite

  • Event: Name der Veranstaltung

  • File: Dateiname mit seiner Erweiterung für Anlagen und alle Dokumentdateien

Das Crawlen von OneNote Dokumenten wird derzeit nicht unterstützt.

Der Datenquellen-Connector crawlt bei jeder Synchronisierung Ihrer Datenquelle mit Ihrer Wissensdatenbank neue, geänderte und gelöschte Inhalte. Amazon Bedrock kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu crawlen, die sich seit der letzten Synchronisierung geändert haben. Wenn Sie Ihre Datenquelle zum ersten Mal mit Ihrer Wissensdatenbank synchronisieren, werden alle Inhalte standardmäßig gecrawlt.

Um Ihre Datenquelle mit Ihrer Wissensdatenbank zu synchronisieren, verwenden Sie die StartIngestionJobAPIoder wählen Sie Ihre Wissensdatenbank in der Konsole aus und wählen Sie im Bereich Datenquellenübersicht die Option Synchronisieren aus.

Wichtig

Alle Daten, die Sie aus Ihrer Datenquelle synchronisieren, stehen allen Personen zur Verfügung, die zum bedrock:Retrieve Abrufen der Daten berechtigt sind. Dies kann auch alle Daten mit kontrollierten Datenquellenberechtigungen einschließen. Weitere Informationen finden Sie unter Knowledgebase-Berechtigungen.

Für die OAuth 2.0-Authentifizierung AWS Secrets Manager müssen Ihre geheimen Authentifizierungsdaten diese Schlüssel-Wert-Paare enthalten

  • username: SharePoint admin username

  • password: SharePoint admin password

  • clientId: OAuth app client ID

  • clientSecret: OAuth app client secret

Für die ShapePoint reine App-Authentifizierung AWS Secrets Manager müssen Ihre geheimen Authentifizierungsdaten die folgenden Schlüssel-Wert-Paare enthalten:

  • clientID: client ID associated with your Microsoft Entra SharePoint application

  • clientSecret: client secret associated with your Microsoft Entra SharePoint application

  • sharepointClientId: client ID generated when registering your SharePoint app for App-Only authentication

  • sharePointClientSecret: client secret generated when registering your SharePoint app for App-Only authentication

Anmerkung

Ihr Secret-In AWS Secrets Manager muss dieselbe Region Ihrer Wissensdatenbank verwenden.

Console
Eine SharePoint Instanz mit Ihrer Wissensdatenbank Connect
  1. Folgen Sie den Schritten unter Erstellen Sie eine Wissensdatenbank in Amazon Bedrock Knowledge Bases und wählen Sie SharePointals Datenquelle aus.

  2. Geben Sie einen Namen und eine optionale Beschreibung für die Datenquelle an.

  3. Geben Sie Ihre SharePoint Site anURL/URLs. Zum Beispiel für SharePoint Online,https://yourdomain.sharepoint.com/sites/mysite. Sie URL müssen mit beginnen https und enthaltensharepoint.com. Ihre Site URL muss die tatsächliche SharePoint Site sein, nicht sharepoint.com/ oder sites/mysite/home.aspx

  4. Geben Sie den Domainnamen Ihrer SharePoint Instanz an.

  5. Im Abschnitt Erweiterte Einstellungen können Sie optional Folgendes konfigurieren:

    • KMSSchlüssel für die Speicherung transienter Daten. — Sie können die transienten Daten verschlüsseln und gleichzeitig Ihre Daten mit dem Standard Von AWS verwalteter Schlüssel - oder Ihrem eigenen Schlüssel in Einbettungen konvertieren. KMS Weitere Informationen finden Sie unter Verschlüsselung der vorübergehenden Datenspeicherung während der Datenerfassung.

    • Richtlinie zum Löschen von Daten — Sie können die Vektoreinbettungen für Ihre Datenquelle löschen, die standardmäßig im Vektorspeicher gespeichert sind, oder sich dafür entscheiden, die Vektorspeicherdaten beizubehalten.

  6. Geben Sie die Authentifizierungsinformationen ein, um eine Verbindung zu Ihrer SharePoint Instance herzustellen:

    1. Geben Sie für die OAuth 2.0-Authentifizierung und die SharePoint App-Only-Authentifizierung die Mandanten-ID an. Sie finden Ihre Mandanten-ID in den Eigenschaften Ihres Azure Active Directory-Portals oder in Ihrer OAuth Anwendung.

    2. Gehen Sie für die OAuth 2.0-Authentifizierung zu, AWS Secrets Manager um Ihre geheimen Authentifizierungsdaten hinzuzufügen, oder verwenden Sie einen vorhandenen Amazon-Ressourcennamen (ARN) für das von Ihnen erstellte Geheimnis. Ihr Secret muss den SharePoint Admin-Benutzernamen und das Passwort sowie Ihre registrierte App-Client-ID und Ihren geheimen Client-Schlüssel enthalten. Eine Beispielanwendung finden Sie unter Registrieren einer Client-Anwendung in Microsoft Entra ID (früher bekannt als Azure Active Directory) auf der Microsoft Learn-Website.

      Gehen Sie für die SharePoint App-Only-Authentifizierung zu, AWS Secrets Manager um Ihre geheimen Anmeldeinformationen hinzuzufügen, oder verwenden Sie einen vorhandenen Amazon-Ressourcennamen (ARN) für das von Ihnen erstellte Geheimnis. Ihr geheimer Schlüssel muss die SharePoint Client-ID enthalten, die Sie bei der Registrierung von App Only auf Mandantenebene generiert haben, das SharePoint Client-Geheimnis, das bei der Registrierung für App Only auf Mandantenebene generiert wurde, die Entra-Client-ID, die bei der Registrierung SharePoint in Entra generiert wurde, und das Entra-Kundengeheimnis, das bei der Registrierung bei Entra generiert wurde. SharePoint

  7. (Optional) Im Bereich Inhaltsanalyse und Chunking können Sie anpassen, wie Ihre Daten analysiert und aufgeteilt werden sollen. Weitere Informationen zu diesen Anpassungen finden Sie in den folgenden Ressourcen:

  8. Wählen Sie, ob Sie Filter oder Muster mit regulären Ausdrücken verwenden möchten, um bestimmte Inhalte ein- oder auszuschließen. Andernfalls werden alle Standardinhalte gecrawlt.

  9. Wählen Sie weiterhin ein Einbettungsmodell und einen Vektorspeicher aus. Um die verbleibenden Schritte zu sehen, kehren Sie zu dem Schritt zurück, nachdem Sie Ihre Datenquelle verbunden haben, Erstellen Sie eine Wissensdatenbank in Amazon Bedrock Knowledge Bases und fahren Sie mit diesem fort.

API

Im Folgenden finden Sie ein Beispiel für eine Konfiguration für die Verbindung zu SharePoint Online für Ihre Amazon Bedrock-Wissensdatenbank. Sie konfigurieren Ihre Datenquelle mithilfe von API mit AWS CLI oder unterstütztSDK, z. B. Python. Nach dem Aufrufen rufen Sie an CreateKnowledgeBase, CreateDataSourceum Ihre Datenquelle mit Ihren Verbindungsinformationen zu erstellendataSourceConfiguration.

Weitere Informationen zu Anpassungen, die Sie bei der Datenerfassung vornehmen können, indem Sie das optionale vectorIngestionConfiguration Feld einbeziehen, finden Sie unter. Passen Sie die Aufnahme für eine Datenquelle an

AWS Command Line Interface

aws bedrock create-data-source \ --name "SharePoint Online connector" \ --description "SharePoint Online data source connector for Amazon Bedrock to use content in SharePoint" \ --knowledge-base-id "your-knowledge-base-id" \ --data-source-configuration file://sharepoint-bedrock-connector-configuration.json \ --data-deletion-policy "DELETE" \ --vector-ingestion-configuration '{"chunkingConfiguration":[{"chunkingStrategy":"FIXED_SIZE","fixedSizeChunkingConfiguration":[{"maxTokens":"100","overlapPercentage":"10"}]}]}' sharepoint-bedrock-connector-configuration.json { "sharePointConfiguration": { "sourceConfiguration": { "tenantId": "888d0b57-69f1-4fb8-957f-e1f0bedf64de", "hostType": "ONLINE", "domain": "yourdomain", "siteUrls": [ "https://yourdomain.sharepoint.com/sites/mysite" ], "authType": "OAUTH2_CLIENT_CREDENTIALS", "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-SharePoint" }, "crawlerConfiguration": { "filterConfiguration": { "type": "PATTERN", "patternObjectFilter": { "filters": [ { "objectType": "File", "inclusionFilters": [ ".*\\.pdf" ], "exclusionFilters": [ ".*private.*\\.pdf" ] } ] } } } }, "type": "SHAREPOINT" }