OneDrive Microsoft-Anschluss V2.0 - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

OneDrive Microsoft-Anschluss V2.0

Microsoft OneDrive ist ein Cloud-basierter Speicherdienst, mit dem Sie Ihre Inhalte speichern, teilen und hosten können. Sie können Amazon Kendra es verwenden, um Ihre OneDrive Datenquelle zu indizieren.

Sie können über Amazon Kendra die Amazon Kendra Konsole und die OneDriveConfigurationAPI eine Verbindung zu Ihrer OneDrive Datenquelle herstellen.

Anmerkung

Die Support für OneDrive Connector V1.0/ OneDriveConfiguration API wird voraussichtlich im Juni 2023 eingestellt. Wir empfehlen die Verwendung von OneDrive Connector V2.0/ TemplateConfiguration API. Version 2.0 bietet zusätzliche ACLs und Identity Crawler-Funktionen.

Informationen zur Fehlerbehebung bei Ihrem Amazon Kendra OneDrive Datenquellen-Connector finden Sie unter. Problembehandlung bei Datenquellen

Unterstützte Features

Amazon Kendra OneDrive Ein Datenquellenconnector unterstützt die folgenden Funktionen:

  • Feldzuordnungen

  • Steuerung des Benutzerzugriffs

  • Einschluss-/Ausschlussfilter

  • Vollständige und inkrementelle Inhaltssynchronisierung

  • Virtual Private Cloud (VPC)

Voraussetzungen

Bevor Sie Ihre OneDrive Datenquelle Amazon Kendra zum Indizieren verwenden können, nehmen Sie diese Änderungen in Ihren Konten OneDrive und AWS Konten vor.

Stellen Sie sicher OneDrive, dass Sie Folgendes haben:

  • Ein OneDrive Konto in Office 365 erstellt.

  • Haben Sie Ihre Microsoft 365-Mandanten-ID notiert. Sie finden Ihre Mandanten-ID in den Eigenschaften Ihres Azure Active Directory-Portals oder in Ihrer OAuth-Anwendung.

  • Sie haben eine OAuth-Anwendung im Azure-Portal erstellt und die Client-ID und das Client-Geheimnis oder die für die Authentifizierung verwendeten Client-Anmeldeinformationen mit einem Geheimnis notiert. AWS Secrets Manager Weitere Informationen finden Sie im Microsoft-Tutorial und im Beispiel für registrierte Apps.

    Anmerkung

    Wenn Sie eine App im Azure-Portal erstellen oder registrieren, stellt die geheime ID den tatsächlichen geheimen Wert dar. Sie müssen den tatsächlichen geheimen Wert sofort bei der Erstellung des Geheimnisses und der App notieren oder speichern. Sie können auf Ihr Geheimnis zugreifen, indem Sie den Namen Ihrer Anwendung im Azure-Portal auswählen und dann zur Menüoption für Zertifikate und Geheimnisse navigieren.

    Sie können auf Ihre Client-ID zugreifen, indem Sie den Namen Ihrer Anwendung im Azure-Portal auswählen und dann zur Übersichtsseite navigieren. Die Anwendungs-ID (Client) ist die Client-ID.

    Anmerkung

    Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihr Geheimnis regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.

  • Hat die AD-Anwendungs-ID verwendet, um einen geheimen Schlüssel für die Anwendung auf der AD-Site zu registrieren. Der geheime Schlüssel muss die Anwendungs-ID und einen geheimen Schlüssel enthalten.

  • Die AD-Domäne der Organisation wurde kopiert.

  • Ihrer AD-Anwendung wurden die folgenden Berechtigungen für die Microsoft Graph-Option hinzugefügt:

    • Dateien in allen Websitesammlungen lesen (File.Read.All)

    • Lesen Sie die vollständigen Profile aller Benutzer (User.Read.All)

    • Alle Gruppen lesen (Group.Read.All)

    • Alle Notizen lesen (Notes.Read.All)

  • Die Liste der Benutzer wurde kopiert, deren Dokumente indexiert werden müssen. Sie können wählen, ob Sie eine Liste mit Benutzernamen angeben möchten, oder Sie können die Benutzernamen in einer Datei angeben, die in einer gespeichert ist Amazon S3. Nachdem Sie die Datenquelle erstellt haben, können Sie:

    • Die Benutzerliste ändern.

    • Wechseln Sie von einer Benutzerliste zu einer in einem Amazon S3 Bucket gespeicherten Liste.

    • Ändern Sie den Amazon S3 Bucket-Speicherort einer Benutzerliste. Wenn Sie den Bucket-Speicherort ändern, müssen Sie auch die IAM Rolle für die Datenquelle aktualisieren, damit sie Zugriff auf den Bucket hat.

      Anmerkung

      Wenn Sie die Liste der Benutzernamen in einem Amazon S3 Bucket speichern, muss die IAM Richtlinie für die Datenquelle den Zugriff auf den Bucket und gegebenenfalls den Zugriff auf den Schlüssel ermöglichen, mit dem der Bucket verschlüsselt wurde.

      Der OneDrive Connector verwendet E-Mail von Kontaktinformationen, die in den OneDrive-Benutzereigenschaften vorhanden sind. Stellen Sie sicher, dass für den Benutzer, dessen Daten Sie crawlen möchten, das E-Mail-Feld auf der Seite mit den Kontaktinformationen konfiguriert ist, da es für neue Benutzer möglicherweise leer ist.

Stellen Sie sicher, dass Sie in Ihrem AWS Konto Folgendes haben:

  • Hat einen Amazon Kendra Index erstellt und bei Verwendung der API die Index-ID notiert.

  • Sie haben eine IAM Rolle für Ihre Datenquelle erstellt und, falls Sie die API verwenden, den ARN der IAM Rolle notiert.

  • Wir haben Ihre OneDrive Authentifizierungsdaten AWS Secrets Manager geheim gespeichert und, falls Sie die API verwenden, den ARN des Geheimnisses notiert.

Wenn Sie noch keine IAM Rolle oder keinen Schlüssel haben, können Sie die Konsole verwenden, um eine neue IAM Rolle und ein neues Secrets Manager Geheimnis zu erstellen, wenn Sie Ihre OneDrive Datenquelle mit verbinden Amazon Kendra. Wenn Sie die API verwenden, müssen Sie den ARN einer vorhandenen IAM Rolle und eines Secrets Manager Geheimnisses sowie eine Index-ID angeben.

Anweisungen zur Verbindung

Um eine Verbindung Amazon Kendra zu Ihrer OneDrive Datenquelle herzustellen, müssen Sie Details zu Ihren OneDrive Anmeldeinformationen angeben, damit Sie auf Ihre Daten zugreifen Amazon Kendra können. Falls Sie das noch nicht konfiguriert haben Amazon Kendra, finden Sie OneDrive weitere Informationen unterVoraussetzungen.

Console

Um eine Verbindung Amazon Kendra herzustellen OneDrive

  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Kendra Konsole.

  2. Wählen Sie im linken Navigationsbereich Indizes und dann den Index, den Sie verwenden möchten, aus der Indexliste aus.

    Anmerkung

    Sie können Ihre Einstellungen für die Benutzerzugriffskontrolle unter Indexeinstellungen konfigurieren oder bearbeiten.

  3. Wählen Sie auf der Seite Erste Schritte die Option Datenquelle hinzufügen aus.

  4. Wählen Sie auf der Seite Datenquelle hinzufügen die Option OneDrive Connector und dann Connector hinzufügen aus. Wenn Sie Version 2 verwenden (falls zutreffend), wählen Sie den OneDrive Connector mit dem Tag „V2.0".

  5. Geben Sie auf der Seite „Datenquellendetails angeben“ die folgenden Informationen ein:

    1. Geben Sie im Feld Name und Beschreibung für Datenquellenname einen Namen für Ihre Datenquelle ein. Sie können Bindestriche, aber keine Leerzeichen verwenden.

    2. (Optional) Beschreibung — Geben Sie eine optionale Beschreibung für Ihre Datenquelle ein.

    3. In Standardsprache — Wählen Sie eine Sprache aus, um Ihre Dokumente nach dem Index zu filtern. Sofern Sie nichts anderes angeben, ist die Standardsprache Englisch. Die in den Metadaten des Dokuments angegebene Sprache hat Vorrang vor der ausgewählten Sprache.

    4. Unter Tags für Neues Tag hinzufügen — Fügen Sie optionale Tags hinzu, um Ihre Ressourcen zu durchsuchen und zu filtern oder Ihre Kosten nachzuverfolgen. AWS

    5. Wählen Sie Weiter aus.

  6. Geben Sie auf der Seite Zugriff und Sicherheit definieren die folgenden Informationen ein:

    1. OneDrive Mandanten-ID — Geben Sie die OneDrive Mandanten-ID ohne das Protokoll ein.

    2. Autorisierung — Aktivieren oder deaktivieren Sie die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, wenn Sie über eine ACL verfügen und diese für die Zugriffskontrolle verwenden möchten. Die ACL gibt an, auf welche Dokumente Benutzer und Gruppen zugreifen können. Die ACL-Informationen werden verwendet, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Weitere Informationen finden Sie unter Benutzerkontextfilterung.

    3. Bei der Authentifizierung — Wählen Sie zwischen „Neu“ und „Bestehend“.

      1. Wenn Sie „Existierend“ wählen, wählen Sie unter „Geheimnis auswählen“ ein vorhandenes Geheimnis aus.

      2. Wenn Sie Neu wählen, geben Sie die folgenden Informationen in den Abschnitt Neues AWS Secrets Manager Geheimnis ein:

        1. Geheimer Name — Ein Name für Ihr Geheimnis. Das Präfix 'AmazonKendra- OneDrive -' wird Ihrem geheimen Namen automatisch hinzugefügt.

        2. Für Client ID und Client Secret — Geben Sie die Client-ID und den geheimen Client-Schlüssel ein.

    4. Virtual Private Cloud (VPC) — Sie können wählen, ob Sie eine VPC verwenden möchten. In diesem Fall müssen Sie Subnetze und VPC-Sicherheitsgruppen hinzufügen.

    5. Identity Crawler — Geben Sie an, ob der Identity Crawler aktiviert Amazon Kendra werden soll. Der Identity Crawler verwendet die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Wenn Sie über eine ACL für Ihre Dokumente verfügen und sich dafür entscheiden, Ihre ACL zu verwenden, können Sie auch den Identity Crawler aktivieren, um die Benutzerkontextfilterung von Suchergebnissen zu konfigurieren. Amazon Kendra Andernfalls können alle Dokumente öffentlich durchsucht werden, wenn Identity Crawler ausgeschaltet ist. Wenn Sie die Zugriffskontrolle für Ihre Dokumente verwenden möchten und Identity Crawler ausgeschaltet ist, können Sie alternativ die PutPrincipalMappingAPI verwenden, um Benutzer- und Gruppenzugriffsinformationen für die Benutzerkontextfilterung hochzuladen.

    6. IAM Rolle — Wählen Sie eine bestehende IAM Rolle oder erstellen Sie eine neue IAM Rolle, um auf Ihre Repository-Anmeldeinformationen und Indexinhalte zuzugreifen.

      Anmerkung

      IAM Rollen, die für Indizes verwendet werden, können nicht für Datenquellen verwendet werden. Wenn Sie sich nicht sicher sind, ob eine vorhandene Rolle für einen Index oder eine häufig gestellte Frage verwendet wird, wählen Sie Neue Rolle erstellen, um Fehler zu vermeiden.

    7. Wählen Sie Weiter aus.

  7. Geben Sie auf der Seite „Synchronisierungseinstellungen konfigurieren“ die folgenden Informationen ein:

    1. Für den Synchronisierungsbereich — Wählen Sie aus, welche OneDrive Benutzerdaten indexiert werden sollen. Sie können maximal 10 Benutzer manuell hinzufügen.

    2. Für zusätzliche Konfigurationen — Fügen Sie Muster für reguläre Ausdrücke hinzu, um bestimmte Inhalte ein- oder auszuschließen. Sie können bis zu 100 Muster hinzufügen.

    3. Synchronisierungsmodus — Wählen Sie aus, wie Sie Ihren Index aktualisieren möchten, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen.

      • Vollständige Synchronisierung: Indizieren Sie alle Inhalte neu und ersetzen vorhandene Inhalte jedes Mal, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.

      • Neue, geänderte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue und geänderte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

      • Neue, geänderte, gelöschte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

    4. Wählen Sie im Zeitplan für die Synchronisierungsausführung unter Frequenz aus, wie oft der Inhalt Ihrer Datenquelle synchronisiert und der Index aktualisiert werden soll.

    5. Wählen Sie Weiter aus.

  8. Geben Sie auf der Seite Feldzuordnungen festlegen die folgenden Informationen ein:

    1. Standard-Datenquellenfelder — Wählen Sie eines der Amazon Kendra generierten Standard-Datenquellenfelder aus, die Sie Ihrem Index zuordnen möchten.

    2. Wählen Sie Weiter aus.

  9. Überprüfen Sie auf der Seite Überprüfen und erstellen, ob die von Ihnen eingegebenen Informationen korrekt sind, und wählen Sie dann Datenquelle hinzufügen aus. Sie können Ihre Informationen auch auf dieser Seite bearbeiten. Ihre Datenquelle wird auf der Seite Datenquellen angezeigt, nachdem die Datenquelle erfolgreich hinzugefügt wurde.

API

Um eine Verbindung Amazon Kendra herzustellen OneDrive

Sie müssen mithilfe der TemplateConfigurationAPI ein JSON des Datenquellenschemas angeben. Sie müssen die folgenden Informationen angeben:

  • Datenquelle — Geben Sie den Datenquellentyp wie ONEDRIVEV2 bei der Verwendung des TemplateConfigurationJSON-Schemas an. Geben Sie außerdem die Datenquelle so anTEMPLATE, wie Sie die CreateDataSourceAPI aufrufen.

  • Mandanten-ID — Geben Sie die Microsoft 365-Mandanten-ID an. Sie finden Ihre Mandanten-ID in den Eigenschaften Ihres Azure Active Directory-Portals oder in Ihrer OAuth-Anwendung.

  • Synchronisierungsmodus — Geben Sie an, wie Ihr Index aktualisiert Amazon Kendra werden soll, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen. Sie können wählen zwischen:

    • FORCED_FULL_CRAWLum den gesamten Inhalt neu zu indizieren und vorhandene Inhalte jedes Mal zu ersetzen, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.

    • FULL_CRAWLum bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte zu indizieren. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

    • CHANGE_LOGum bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue und geänderte Inhalte zu indizieren. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

  • Geheimer Amazon-Ressourcenname (ARN) — Geben Sie den Amazon-Ressourcennamen (ARN) eines Secrets Manager Geheimnisses ein, das die Authentifizierungsdaten enthält, die Sie in Ihrem OneDrive Konto erstellt haben.

    Wenn Sie die OAuth 2.0-Authentifizierung verwenden, wird das Geheimnis in einer JSON-Struktur mit den folgenden Schlüsseln gespeichert:

    { "clientId": "client ID", "clientSecret": "client secret" }
  • IAM role — Geben Sie anRoleArn, wann Sie aufrufenCreateDataSource, um einer IAM Rolle Berechtigungen für den Zugriff auf Ihr Secrets Manager Geheimnis und den Aufruf der erforderlichen öffentlichen APIs für den OneDrive Connector und zu erteilen. Amazon Kendra Weitere Informationen finden Sie unter IAM Rollen für OneDrive Datenquellen.

Sie können auch die folgenden optionalen Funktionen hinzufügen:

  • Virtual Private Cloud (VPC) — Geben Sie an, VpcConfiguration wann Sie anrufen. CreateDataSource Weitere Informationen finden Sie unter Konfigurieren Amazon Kendra um eine zu verwenden Amazon VPC.

  • Inklusions- und Ausschlussfilter — Sie können angeben, ob bestimmte Dateien, OneNote Abschnitte und Seiten ein- oder ausgeschlossen werden sollen. OneNote

    Anmerkung

    Die meisten Datenquellen verwenden Muster für reguläre Ausdrücke, bei denen es sich um Ein- oder Ausschlussmuster handelt, die als Filter bezeichnet werden. Wenn Sie einen Einschlussfilter angeben, werden nur Inhalte indexiert, die dem Einschlussfilter entsprechen. Jedes Dokument, das nicht dem Einschlussfilter entspricht, wird nicht indexiert. Wenn Sie einen Ein- und Ausschlussfilter angeben, werden Dokumente, die dem Ausschlussfilter entsprechen, nicht indexiert, auch wenn sie dem Einschlussfilter entsprechen.

  • Identity Crawler — Geben Sie an, ob der Identity Crawler aktiviert Amazon Kendra werden soll. Der Identity Crawler verwendet die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Wenn Sie über eine ACL für Ihre Dokumente verfügen und sich dafür entscheiden, Ihre ACL zu verwenden, können Sie auch den Identity Crawler aktivieren, um die Benutzerkontextfilterung von Suchergebnissen zu konfigurieren. Amazon Kendra Andernfalls können alle Dokumente öffentlich durchsucht werden, wenn Identity Crawler ausgeschaltet ist. Wenn Sie die Zugriffskontrolle für Ihre Dokumente verwenden möchten und Identity Crawler ausgeschaltet ist, können Sie alternativ die PutPrincipalMappingAPI verwenden, um Benutzer- und Gruppenzugriffsinformationen für die Benutzerkontextfilterung hochzuladen.

  • Feldzuordnungen — Sie können dem Connector nur integrierte oder allgemeine Indexfelder zuordnen. Amazon Kendra OneDrive Die Zuordnung benutzerdefinierter Felder ist für den OneDrive Connector aufgrund von API-Einschränkungen nicht verfügbar. Weitere Informationen finden Sie unter Zuweisen von Datenquellenfeldern.

Eine Liste weiterer wichtiger JSON-Schlüssel, die konfiguriert werden müssen, finden Sie unter OneDrive Vorlagenschema.