Box (Kasten) - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Box (Kasten)

Box ist ein Cloud-Speicherdienst, der Funktionen zum Hosten von Dateien bietet. Sie können ihn verwenden Amazon Kendra , um Inhalte in Ihren Box-Inhalten zu indizieren, einschließlich Kommentare, Aufgaben und Weblinks.

Sie können mit der Amazon Kendra Konsole und dem eine Verbindung Amazon Kendra zu Ihrer Box-Datenquelle herstellen BoxConfigurationAPI.

Informationen zur Fehlerbehebung bei Ihrem Amazon Kendra Box-Datenquellen-Connector finden Sie unterProblembehandlung bei Datenquellen.

Unterstützte Features

Amazon Kendra Der Box-Datenquellen-Connector unterstützt die folgenden Funktionen:

  • Feldzuordnungen

  • Steuerung des Benutzerzugriffs

  • Einschluss-/Ausschlussfilter

  • Änderungsprotokoll, vollständige und inkrementelle Inhaltssynchronisierung

  • Virtuelle private Cloud () VPC

Voraussetzungen

Bevor Sie Ihre Box-Datenquelle Amazon Kendra zum Indizieren verwenden können, nehmen Sie diese Änderungen in Ihrer Box und Ihren AWS Konten vor.

Stellen Sie in Box sicher, dass Sie über Folgendes verfügen:

  • Ein Box Enterprise- oder Box Enterprise Plus-Konto.

  • In der Box Developer Console wurde eine benutzerdefinierte Box-App mit serverseitiger Authentifizierung mithilfe von JSON Web-Tokens (JWT) konfiguriert. Weitere Informationen finden Sie in der Box-Dokumentation zur Erstellung einer benutzerdefinierten App und in der Box-Dokumentation zur Konfiguration von JWT Auth.

  • Stellen Sie Ihre App-Zugriffsebene auf App + Enterprise Access ein und erlauben Sie der App, APIAnrufe über den As-User-Header zu tätigen.

  • Hat den Admin-Benutzer verwendet, um die folgenden Anwendungsbereiche zu Ihrer Box-App hinzuzufügen:

    • Schreiben Sie alle in einer Box gespeicherten Dateien und Ordner

    • Benutzer verwalten

    • Gruppen verwalten

    • Unternehmenseigenschaften verwalten

  • Konfiguriertes öffentliches/privates key pair, einschließlich einer Client-ID, eines geheimen Client-Schlüssels, einer öffentlichen Schlüssel-ID, einer privaten Schlüssel-ID, einer Passphrase und einer Unternehmens-ID, die als Ihre Authentifizierungsdaten verwendet werden sollen. Weitere Informationen finden Sie unter Paar öffentlicher und privater Schlüssel.

    Anmerkung

    Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihren geheimen Schlüssel regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.

  • Ihre Box Enterprise ID wurde entweder aus den Einstellungen der Box Developer Console oder aus Ihrer Box-App kopiert. Zum Beispiel 801234567.

  • Aktiviert, dass jedes Dokument in Box und in anderen Datenquellen, die Sie für denselben Index verwenden möchten, einzigartig ist. Jede Datenquelle, die Sie für einen Index verwenden möchten, darf nicht dasselbe Dokument in allen Datenquellen enthalten. Dokumente IDs gelten für einen Index global und müssen pro Index eindeutig sein.

Stellen Sie in Ihrem sicher AWS-Konto, dass Sie Folgendes haben:

  • Hat einen Amazon Kendra Index erstellt und, falls Sie den verwendet habenAPI, die Index-ID notiert.

  • Sie haben eine IAM Rolle für Ihre Datenquelle erstellt und, falls Sie die verwendenAPI, ARN die IAM Rolle notiert.

    Anmerkung

    Wenn Sie Ihren Authentifizierungstyp und Ihre Anmeldeinformationen ändern, müssen Sie Ihre IAM Rolle aktualisieren, um auf die richtige AWS Secrets Manager geheime ID zugreifen zu können.

  • Sie haben Ihre Box-Authentifizierungsdaten AWS Secrets Manager geheim gespeichert und, falls Sie den verwendenAPI, den ARN Geheimcode notiert.

    Anmerkung

    Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihr Geheimnis regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.

Wenn Sie noch keine IAM Rolle oder keinen Schlüssel haben, können Sie die Konsole verwenden, um eine neue IAM Rolle und ein neues Secrets Manager Geheimnis zu erstellen, wenn Sie Ihre Box-Datenquelle mit verbinden. Amazon Kendra Wenn Sie die verwendenAPI, müssen Sie die einer vorhandenen IAM Rolle und ARN eines Secrets Manager Geheimnisses sowie eine Index-ID angeben.

Anweisungen zur Verbindung

Um eine Verbindung Amazon Kendra zu Ihrer Box-Datenquelle herzustellen, müssen Sie die erforderlichen Details zu Ihrer Box-Datenquelle angeben, damit Sie auf Ihre Daten zugreifen Amazon Kendra können. Wenn Sie Box für noch nicht konfiguriert haben Amazon Kendra, finden Sie weitere Informationen unterVoraussetzungen.

Console

Um eine Verbindung Amazon Kendra zu Box herzustellen

  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Kendra Konsole.

  2. Wählen Sie im linken Navigationsbereich Indizes und dann den Index, den Sie verwenden möchten, aus der Indexliste aus.

    Anmerkung

    Sie können Ihre Einstellungen für die Benutzerzugriffskontrolle unter Indexeinstellungen konfigurieren oder bearbeiten.

  3. Wählen Sie auf der Seite Erste Schritte die Option Datenquelle hinzufügen aus.

  4. Wählen Sie auf der Seite Datenquelle hinzufügen die Option Box-Konnektor und dann Konnektor hinzufügen aus. Wenn Sie Version 2 verwenden (falls zutreffend), wählen Sie Box Connector mit dem Tag „V2.0".

  5. Geben Sie auf der Seite „Datenquellendetails angeben“ die folgenden Informationen ein:

    1. Geben Sie im Feld Name und Beschreibung für Datenquellenname einen Namen für Ihre Datenquelle ein. Sie können Bindestriche, aber keine Leerzeichen verwenden.

    2. (Optional) Beschreibung — Geben Sie eine optionale Beschreibung für Ihre Datenquelle ein.

    3. In Standardsprache — Wählen Sie eine Sprache aus, um Ihre Dokumente nach dem Index zu filtern. Sofern Sie nichts anderes angeben, ist die Standardsprache Englisch. Die in den Metadaten des Dokuments angegebene Sprache hat Vorrang vor der ausgewählten Sprache.

    4. Unter Tags für Neues Tag hinzufügen — Fügen Sie optionale Tags hinzu, um Ihre Ressourcen zu durchsuchen und zu filtern oder Ihre Kosten nachzuverfolgen. AWS

    5. Wählen Sie Weiter.

  6. Geben Sie auf der Seite Zugriff und Sicherheit definieren die folgenden Informationen ein:

    1. Box Enterprise ID — Geben Sie Ihre Box Enterprise ID ein. Zum Beispiel 801234567.

    2. Autorisierung — Schalten Sie Informationen aus der Zugriffskontrollliste (ACL) für Ihre Dokumente ein oder aus, falls Sie über eine verfügen ACL und diese für die Zugriffskontrolle verwenden möchten. Die ACL gibt an, auf welche Dokumente Benutzer und Gruppen zugreifen können. Die ACL Informationen werden verwendet, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Weitere Informationen finden Sie unter Benutzerkontextfilterung.

    3. AWS Secrets Manager geheim — Wählen Sie ein vorhandenes Geheimnis oder erstellen Sie ein neues Secrets Manager Geheimnis, um Ihre Box-Authentifizierungsdaten zu speichern. Wenn Sie sich dafür entscheiden, ein neues Geheimnis zu erstellen, wird ein AWS Secrets Manager geheimes Fenster geöffnet.

      1. Geheimer Name — Ein Name für Ihr Geheimnis. Das Präfix 'AmazonKendra-Box' wird Ihrem geheimen Namen automatisch hinzugefügt.

      2. Geben Sie für Client-ID, Client Secret, Public Key-ID, Private Key-ID und Passphrase die Werte aus dem öffentlichen/privaten Schlüssel ein, den Sie in Box konfiguriert haben.

      3. Fügen Sie Ihr Geheimnis hinzu und speichern Sie es.

    4. Virtual Private Cloud (VPC) — Sie können wählen, ob Sie eine VPC verwenden möchten. Wenn ja, müssen Sie Subnetze und VPCSicherheitsgruppen hinzufügen.

    5. Identity Crawler — Geben Sie an, ob der Identity Crawler aktiviert Amazon Kendra werden soll. Der Identity Crawler verwendet die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Wenn Sie über eine ACL für Ihre Dokumente verfügen und Ihre verwenden möchtenACL, können Sie auch den Identity Crawler aktivieren, um die Benutzerkontextfilterung von Suchergebnissen zu konfigurieren. Amazon Kendra Andernfalls können alle Dokumente öffentlich durchsucht werden, wenn der Identity Crawler ausgeschaltet ist. Wenn Sie die Zugriffskontrolle für Ihre Dokumente verwenden möchten und Identity Crawler ausgeschaltet ist, können Sie alternativ den verwenden, PutPrincipalMappingAPIum Benutzer- und Gruppenzugriffsinformationen für die Benutzerkontextfilterung hochzuladen.

    6. IAM Rolle — Wählen Sie eine bestehende IAM Rolle oder erstellen Sie eine neue IAM Rolle, um auf Ihre Repository-Anmeldeinformationen und Indexinhalte zuzugreifen.

      Anmerkung

      IAM Rollen, die für Indizes verwendet werden, können nicht für Datenquellen verwendet werden. Wenn Sie sich nicht sicher sind, ob eine vorhandene Rolle für einen Index verwendet wirdFAQ, wählen Sie Neue Rolle erstellen, um Fehler zu vermeiden.

    7. Wählen Sie Weiter.

  7. Geben Sie auf der Seite Synchronisierungseinstellungen konfigurieren die folgenden Informationen ein:

    1. Box-Dateien — Wählen Sie aus, ob Weblinks, Kommentare und Aufgaben gecrawlt werden sollen.

    2. Für zusätzliche Konfigurationen — Fügen Sie Muster für reguläre Ausdrücke hinzu, um bestimmte Inhalte ein- oder auszuschließen.

    3. Synchronisierungsmodus — Wählen Sie aus, wie Sie Ihren Index aktualisieren möchten, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen.

      • Vollständige Synchronisierung: Indizieren Sie den gesamten Inhalt neu und ersetzen die vorhandenen Inhalte jedes Mal, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.

      • Neue, geänderte Synchronisierung: Indizieren Sie jedes Mal, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird, nur neue und geänderte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

      • Neue, geänderte, gelöschte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

    4. Zeitplan für In-Sync-Ausführung für Häufigkeit — Wählen Sie aus, wie oft Ihre Datenquelleninhalte synchronisiert und Ihr Index aktualisiert werden soll.

    5. Wählen Sie Weiter.

  8. Geben Sie auf der Seite Feldzuordnungen festlegen die folgenden Informationen ein:

    1. Standard-Datenquellenfelder — Wählen Sie eines der Amazon Kendra generierten Standard-Datenquellenfelder aus, die Sie Ihrem Index zuordnen möchten.

    2. Feld hinzufügen — Um benutzerdefinierte Datenquellenfelder hinzuzufügen, um einen Indexfeldnamen für die Zuordnung und den Felddatentyp zu erstellen.

    3. Wählen Sie Weiter.

  9. Überprüfen Sie auf der Seite Überprüfen und erstellen, ob die von Ihnen eingegebenen Informationen korrekt sind, und wählen Sie dann Datenquelle hinzufügen aus. Sie können Ihre Informationen auch auf dieser Seite bearbeiten. Ihre Datenquelle wird auf der Seite Datenquellen angezeigt, nachdem die Datenquelle erfolgreich hinzugefügt wurde.

API

Um eine Verbindung Amazon Kendra zu Box herzustellen

Mit dem müssen Sie Folgendes angeben BoxConfigurationAPI:

Box Enterprise ID — Geben Sie Ihre Box Enterprise ID an. Sie finden die Unternehmens-ID in den Einstellungen der Box Developer Console oder bei der Konfiguration einer App in Box.

  • Geheimer Amazon-Ressourcenname (ARN) — Geben Sie den Amazon-Ressourcennamen (ARN) eines Secrets Manager Geheimnisses ein, das die Authentifizierungsdaten für Ihr Box-Konto enthält. Das Geheimnis wird in einer JSON Struktur mit den folgenden Schlüsseln gespeichert:

    { "clientID": "client-id", "clientSecret": "client-secret", "publicKeyID": "public-key-id", "privateKey": "private-key", "passphrase": "pass-phrase" }
  • IAM Rolle — Geben Sie anRoleArn, wann Sie anrufenCreateDataSource, um einer IAM Rolle Berechtigungen für den Zugriff auf Ihr Secrets Manager Geheimnis zu gewähren und die erforderliche Öffentlichkeit APIs für den Box-Connector und Amazon Kendra anzurufen. Weitere Informationen finden Sie unter IAM Rollen für Box-Datenquellen.

Sie können auch die folgenden optionalen Funktionen hinzufügen:

  • Virtual Private Cloud (VPC) — Geben Sie dies VpcConfiguration als Teil der Datenquellenkonfiguration an. Weitere Informationen finden Sie unter Konfiguration Amazon Kendra für die Verwendung von. VPC

  • Änderungsprotokoll — Gibt an, ob der Änderungsprotokollmechanismus der Box-Datenquelle verwendet werden Amazon Kendra soll, um festzustellen, ob ein Dokument im Index aktualisiert werden muss.

    Anmerkung

    Verwenden Sie das Änderungsprotokoll, wenn Sie nicht alle Dokumente scannen Amazon Kendra möchten. Wenn Ihr Änderungsprotokoll umfangreich ist, nimmt das Scannen der Dokumente in der Box-Datenquelle möglicherweise Amazon Kendra weniger Zeit in Anspruch als das Verarbeiten des Änderungsprotokolls. Wenn Sie Ihre Box-Datenquelle zum ersten Mal mit Ihrem Index synchronisieren, werden alle Dokumente gescannt.

  • Kommentare, Aufgaben, Weblinks — Geben Sie an, ob diese Inhaltstypen gecrawlt werden sollen.

    Anmerkung

    Die meisten Datenquellen verwenden Muster für reguläre Ausdrücke, bei denen es sich um Ein- oder Ausschlussmuster handelt, die als Filter bezeichnet werden. Wenn Sie einen Einschlussfilter angeben, werden nur Inhalte indexiert, die dem Einschlussfilter entsprechen. Jedes Dokument, das nicht dem Einschlussfilter entspricht, wird nicht indexiert. Wenn Sie einen Ein- und Ausschlussfilter angeben, werden Dokumente, die dem Ausschlussfilter entsprechen, nicht indexiert, auch wenn sie dem Einschlussfilter entsprechen.

  • Ein- und Ausschlussfilter — Geben Sie an, ob bestimmte Box-Dateien und -Ordner ein- oder ausgeschlossen werden sollen.

    Anmerkung

    Die meisten Datenquellen verwenden Muster für reguläre Ausdrücke, bei denen es sich um Ein- oder Ausschlussmuster handelt, die als Filter bezeichnet werden. Wenn Sie einen Einschlussfilter angeben, werden nur Inhalte indexiert, die dem Einschlussfilter entsprechen. Jedes Dokument, das nicht dem Einschlussfilter entspricht, wird nicht indexiert. Wenn Sie einen Ein- und Ausschlussfilter angeben, werden Dokumente, die dem Ausschlussfilter entsprechen, nicht indexiert, auch wenn sie dem Einschlussfilter entsprechen.

  • Benutzerkontextfilterung und ZugriffskontrolleAmazon Kendra — durchsucht die Zugriffskontrollliste (ACL) für Ihre Dokumente, sofern Sie eine ACL für Ihre Dokumente haben. Die ACL Informationen werden verwendet, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Weitere Informationen finden Sie unter Benutzerkontextfilterung.

  • Feldzuordnungen — Wählen Sie diese Option, um Ihre Box-Datenquellenfelder Ihren Amazon Kendra Indexfeldern zuzuordnen. Weitere Informationen finden Sie unter Zuweisen von Datenquellenfeldern.

    Anmerkung

    Das Textfeld oder das entsprechende Textfeld für Ihre Dokumente ist erforderlich, um Ihre Dokumente durchsuchen Amazon Kendra zu können. Sie müssen den Feldnamen Ihres Dokumenthauptteils in Ihrer Datenquelle dem Namen des Indexfeldes zuordnen_document_body. Alle anderen Felder sind optional.

Weitere Informationen

Weitere Informationen zur Integration Amazon Kendra mit Ihrer Box-Datenquelle finden Sie unter: