Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Connect zu Microsoft her, SharePoint um Ihre Amazon Bedrock-Wissensdatenbank zu erhalten
Microsoft SharePoint ist ein kollaborativer webbasierter Dienst für die Arbeit an Dokumenten, Webseiten, Websites, Listen und mehr. Sie können eine Verbindung zu Ihrer SharePoint Instance für Ihre Amazon Bedrock-Wissensdatenbank herstellen, indem Sie entweder die AWS Management Console für Amazon Bedrock
Anmerkung
Amazon Bedrock unterstützt die Verbindung zu SharePoint Online-Instances. Das Crawlen von OneNote Dokumenten wird derzeit nicht unterstützt. Derzeit ist nur Amazon OpenSearch Serverless Vector Store für die Verwendung mit dieser Datenquelle verfügbar.
Es gibt Beschränkungen für die Anzahl der Dateien und MB pro Datei, die gecrawlt werden können. Informationen zu Wissensdatenbanken finden Sie unter Kontingente.
Unterstützte Features
-
Automatische Erkennung der wichtigsten Dokumentfelder
-
Inhaltsfilter zum Einschließen/Ausschließen
-
Inkrementelle Inhaltssynchronisierung für hinzugefügte, aktualisierte und gelöschte Inhalte
-
OAuth2.0-Authentifizierung und reine SharePoint App-Authentifizierung
Voraussetzungen
Stellen SharePoint Sie für die OAuth 2.0-Authentifizierung sicher, dass Sie:
-
Notieren Sie sich Ihre SharePoint Online-SiteURL/URLs. Beispiel,
https://yourdomain.sharepoint.com/sites/mysite
. Sie URL müssen mit beginnenhttps
und enthaltensharepoint.com
. Ihre Site URL muss die tatsächliche SharePoint Site sein, nichtsharepoint.com/
odersites/mysite/home.aspx
-
Notieren Sie sich den Domainnamen Ihrer SharePoint Online-InstanzURL/URLs.
-
Kopieren Sie Ihre Microsoft 365-Mandanten-ID. Sie finden Ihre Mandanten-ID in den Eigenschaften Ihres Microsoft Entra-Portals oder in Ihrer OAuth Anwendung.
Notieren Sie sich den Benutzernamen und das Passwort des SharePoint Administratorkontos und kopieren Sie bei der Registrierung einer Anwendung die Client-ID und den geheimen Client-Wert.
Anmerkung
Eine Beispielanwendung finden Sie unter Registrieren einer Client-Anwendung in Microsoft Entra ID
(früher bekannt als Azure Active Directory) auf der Microsoft Learn-Website. -
SharePoint Bei der Registrierung einer Anwendung sind bestimmte Leseberechtigungen erforderlich, um eine Verbindung herzustellen.
-
SharePoint: AllSites .Read (delegiert) — Elemente in allen Websitesammlungen lesen
-
-
Möglicherweise müssen Sie die Sicherheitsstandards in Ihrem Azure-Portal mithilfe eines Administratorbenutzers deaktivieren. Weitere Informationen zur Verwaltung von Sicherheitsstandardeinstellungen im Azure-Portal finden Sie in der Microsoft-Dokumentation zum Aktivieren/Deaktivieren
von Sicherheitsstandards. -
Möglicherweise müssen Sie die Multi-Faktor-Authentifizierung (MFA) in Ihrem SharePoint Konto deaktivieren, damit Amazon Bedrock nicht daran gehindert wird, Ihre Inhalte zu crawlen. SharePoint
Stellen Sie bei der Authentifizierung SharePoint nur über Apps sicher SharePoint, dass Sie:
-
Kopieren Sie Ihre Microsoft 365-Mandanten-ID. Sie finden Ihre Mandanten-ID in den Eigenschaften Ihres Microsoft Entra-Portals oder in Ihrer OAuth Anwendung.
-
Konfigurieren Sie Anmeldeinformationen, die nur für Sharepoint Apps bestimmt sind.
-
Kopieren Sie die Client-ID und den Wert für den geheimen Client-Schlüssel, wenn Sie App-Only die SharePoint Berechtigung erteilen. Weitere Informationen finden Sie unter Zugriff mit SharePoint App-Only gewähren
. Anmerkung
Sie müssen keine API Berechtigungen für SharePoint App-Only einrichten.
Stellen Sie in Ihrem AWS Konto sicher, dass Sie:
-
Speichern Sie Ihre Authentifizierungsdaten AWS Secrets Manager geheim und notieren Sie sich den Amazon-Ressourcennamen (ARN) des Geheimnisses. Folgen Sie den Anweisungen zur Verbindungskonfiguration auf dieser Seite, um die Schlüssel-Wert-Paare aufzunehmen, die in Ihrem Geheimnis enthalten sein müssen.
-
Nehmen Sie die erforderlichen Berechtigungen für die Verbindung mit Ihrer Datenquelle in Ihre AWS Identity and Access Management (IAM) Rollen-/Berechtigungsrichtlinie für Ihre Wissensdatenbank auf. Informationen zu den erforderlichen Berechtigungen für diese Datenquelle, um sie Ihrer IAM Wissensdatenbank-Rolle hinzuzufügen, finden Sie unter Berechtigungen für den Zugriff auf Datenquellen.
Anmerkung
Wenn Sie die Konsole verwenden, können Sie Ihr Geheimnis AWS Secrets Manager hinzufügen oder ein vorhandenes Geheimnis als Teil des Konfigurationsschritts für die Datenquelle verwenden. Die IAM Rolle mit allen erforderlichen Berechtigungen kann im Rahmen der Konsolenschritte zum Erstellen einer Wissensdatenbank für Sie erstellt werden. Nachdem Sie Ihre Datenquelle und andere Konfigurationen konfiguriert haben, wird die IAM Rolle mit allen erforderlichen Berechtigungen auf Ihre spezifische Wissensdatenbank angewendet.
Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihr Geheimnis regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten in verschiedenen Datenquellen wiederzuverwenden.
Konfiguration der Verbindung
Um eine Verbindung zu Ihrer SharePoint Instance herzustellen, müssen Sie die erforderlichen Konfigurationsinformationen angeben, damit Amazon Bedrock auf Ihre Daten zugreifen und sie crawlen kann. Sie müssen auch dem folgen. Voraussetzungen
Ein Beispiel für eine Konfiguration für diese Datenquelle ist in diesem Abschnitt enthalten.
Weitere Informationen zur auto Erkennung von Dokumentfeldern, Ein-/Ausschlussfiltern, inkrementeller Synchronisierung, geheimen Authentifizierungsdaten und deren Funktionsweise finden Sie unter folgenden Optionen:
Der Datenquellen-Connector erkennt und crawlt automatisch alle wichtigen Metadatenfelder Ihrer Dokumente oder Inhalte. Der Datenquellen-Connector kann beispielsweise den Dokumenttext durchsuchen, der Ihren Dokumenten entspricht, den Dokumenttitel, das Erstellungs- oder Änderungsdatum des Dokuments oder andere Kernfelder, die möglicherweise auf Ihre Dokumente zutreffen.
Wichtig
Wenn Ihr Inhalt vertrauliche Informationen enthält, Amazon Bedrock könnten Sie mit vertraulichen Informationen antworten.
Sie können Filteroperatoren auf Metadatenfelder anwenden, um die Relevanz von Antworten weiter zu verbessern. Zum Beispiel das Dokument „epoch_modification_time“ oder die Anzahl der Sekunden, die seit dem 1. Januar 1970 vergangen sind, als das Dokument zuletzt aktualisiert wurde. Sie können nach den neuesten Daten filtern, wobei „epoch_modification_time“ größer als eine bestimmte Zahl ist. Weitere Informationen zu den Filteroperatoren, die Sie auf Ihre Metadatenfelder anwenden können, finden Sie unter Metadaten und Filterung.
Sie können das Crawlen bestimmter Inhalte ein- oder ausschließen. Sie können beispielsweise ein prefix/regular expression pattern to skip crawling any file that contains “private” in the file name. You could also specify an inclusion prefix/regular Ausschlussausdrucksmuster angeben, um bestimmte Inhaltsentitäten oder Inhaltstypen einzubeziehen. Wenn Sie einen Inklusions- und Ausschlussfilter angeben und beide einem Dokument entsprechen, hat der Ausschlussfilter Vorrang und das Dokument wird nicht gecrawlt.
Ein Beispiel für ein Muster mit regulären Ausdrücken zum Ausschließen oder Herausfiltern von PDF Dateien, die „privat“ im Dateinamen enthalten:“. *private.*\\ .pdf“
Sie können Einschluss-/Ausschlussfilter auf die folgenden Inhaltstypen anwenden:
-
Page
: Titel der Hauptseite -
Event
: Name der Veranstaltung -
File
: Dateiname mit seiner Erweiterung für Anlagen und alle Dokumentdateien
Das Crawlen von OneNote Dokumenten wird derzeit nicht unterstützt.
Der Datenquellen-Connector crawlt bei jeder Synchronisierung Ihrer Datenquelle mit Ihrer Wissensdatenbank neue, geänderte und gelöschte Inhalte. Amazon Bedrock kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu crawlen, die sich seit der letzten Synchronisierung geändert haben. Wenn Sie Ihre Datenquelle zum ersten Mal mit Ihrer Wissensdatenbank synchronisieren, werden alle Inhalte standardmäßig gecrawlt.
Um Ihre Datenquelle mit Ihrer Wissensdatenbank zu synchronisieren, verwenden Sie die StartIngestionJobAPIoder wählen Sie Ihre Wissensdatenbank in der Konsole aus und wählen Sie im Bereich Datenquellenübersicht die Option Synchronisieren aus.
Wichtig
Alle Daten, die Sie aus Ihrer Datenquelle synchronisieren, stehen allen Personen zur Verfügung, die zum bedrock:Retrieve
Abrufen der Daten berechtigt sind. Dies kann auch alle Daten mit kontrollierten Datenquellenberechtigungen einschließen. Weitere Informationen finden Sie unter Knowledgebase-Berechtigungen.
Für die OAuth 2.0-Authentifizierung AWS Secrets Manager müssen Ihre geheimen Authentifizierungsdaten diese Schlüssel-Wert-Paare enthalten
-
username
:SharePoint admin username
-
password
:SharePoint admin password
-
clientId
:OAuth app client ID
-
clientSecret
:OAuth app client secret
Für die ShapePoint reine App-Authentifizierung AWS Secrets Manager müssen Ihre geheimen Authentifizierungsdaten die folgenden Schlüssel-Wert-Paare enthalten:
-
clientID
:client ID associated with your Microsoft Entra SharePoint application
-
clientSecret
:client secret associated with your Microsoft Entra SharePoint application
-
sharepointClientId
:client ID generated when registering your SharePoint app for App-Only authentication
-
sharePointClientSecret
:client secret generated when registering your SharePoint app for App-Only authentication
Anmerkung
Ihr Secret-In AWS Secrets Manager muss dieselbe Region Ihrer Wissensdatenbank verwenden.