Gmail - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Gmail

Gmail ist ein von Google entwickelter E-Mail-Client, über den Sie E-Mail-Nachrichten mit Dateianhängen senden können. Gmail-Nachrichten können mithilfe von Ordnern und Labels sortiert und in Ihrem E-Mail-Posteingang gespeichert werden. Sie können Amazon Kendra damit Ihre E-Mail-Nachrichten und Nachrichtenanhänge indizieren. Sie können auch konfigurieren Amazon Kendra , dass bestimmte E-Mail-Nachrichten, Nachrichtenanhänge und Labels für die Indizierung ein- oder ausgeschlossen werden.

Sie können über Amazon Kendra die Amazon Kendra Konsole und die TemplateConfigurationAPI eine Verbindung zu Ihrer Gmail-Datenquelle herstellen.

Informationen zur Fehlerbehebung bei Ihrem Amazon Kendra Gmail-Datenquellen-Connector finden Sie unterProblembehandlung bei Datenquellen.

Unterstützte Features

  • Feldzuordnungen

  • Steuerung des Benutzerzugriffs

  • Einschluss-/Ausschlussfilter

  • Vollständige und inkrementelle Inhaltssynchronisierung

  • Virtual Private Cloud (VPC)

Voraussetzungen

Bevor Sie Ihre Gmail-Datenquelle Amazon Kendra zum Indizieren verwenden können, müssen Sie diese Änderungen in Ihrem Gmail-Konto und AWS Ihren Konten vornehmen.

Stellen Sie in Gmail sicher, dass Sie über Folgendes verfügen:

  • Sie haben ein Google Cloud Platform-Administratorkonto und ein Google Cloud-Projekt erstellt.

  • Gmail-API und Admin-SDK-API in Ihrem Admin-Konto aktiviert.

  • Sie haben ein Dienstkonto erstellt und einen privaten JSON-Schlüssel für Ihr Gmail heruntergeladen. Informationen dazu, wie Sie Ihren privaten Schlüssel erstellen und darauf zugreifen, finden Sie in der Google Cloud-Dokumentation zum Erstellen eines Dienstkontoschlüssels und zu den Anmeldeinformationen für das Dienstkonto.

  • Die E-Mail-Adresse Ihres Administratorkontos, die E-Mail-Adresse Ihres Dienstkontos und Ihr privater Schlüssel wurden kopiert, um sie als Authentifizierungsdaten zu verwenden.

    Anmerkung

    Wir empfehlen, dass Sie Ihre Anmeldeinformationen und Ihren Geheimcode regelmäßig aktualisieren oder austauschen. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.

  • Die folgenden Oauth-Bereiche (mit einer Administratorrolle) wurden für Ihren Benutzer und die gemeinsam genutzten Verzeichnisse, die Sie indexieren möchten, hinzugefügt:

    • https://www.googleapis.com/auth/admin.directory.user.readonly

    • https://www.googleapis.com/auth/gmail.readonly

  • Vergewissert, dass jedes Dokument in Gmail und allen anderen Datenquellen, die Sie für denselben Index verwenden möchten, einzigartig ist. Jede Datenquelle, die Sie für einen Index verwenden möchten, darf nicht dasselbe Dokument in allen Datenquellen enthalten. Dokument-IDs gelten für einen Index global und müssen pro Index eindeutig sein.

Stellen Sie sicher AWS-Konto, dass Sie Folgendes in Ihrem haben:

  • Hat einen Amazon Kendra Index erstellt und bei Verwendung der API die Index-ID notiert.

  • Sie haben eine IAM Rolle für Ihre Datenquelle erstellt und, falls Sie die API verwenden, den ARN der IAM Rolle notiert.

    Anmerkung

    Wenn Sie Ihren Authentifizierungstyp und Ihre Anmeldeinformationen ändern, müssen Sie Ihre IAM Rolle aktualisieren, um auf die richtige AWS Secrets Manager geheime ID zugreifen zu können.

  • Haben Ihre Gmail-Authentifizierungsdaten AWS Secrets Manager geheim gespeichert und, falls Sie die API verwenden, den ARN des Geheimnisses notiert.

    Anmerkung

    Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihr Passwort regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.

Wenn Sie noch keine IAM Rolle oder keinen Schlüssel haben, können Sie die Konsole verwenden, um eine neue IAM Rolle und ein neues Secrets Manager Geheimnis zu erstellen, wenn Sie Ihre Gmail-Datenquelle mit verbinden. Amazon Kendra Wenn Sie die API verwenden, müssen Sie den ARN einer vorhandenen IAM Rolle und eines Secrets Manager Geheimnisses sowie eine Index-ID angeben.

Anweisungen zur Verbindung

Um eine Verbindung Amazon Kendra zu Ihrer Gmail-Datenquelle herzustellen, müssen Sie Details zu Ihren Gmail-Anmeldeinformationen angeben, damit Sie auf Ihre Daten zugreifen Amazon Kendra können. Falls Sie Gmail noch nicht für konfiguriert haben Amazon Kendra, finden Sie weitere Informationen unterVoraussetzungen.

Console

So stellen Sie eine Verbindung Amazon Kendra zu Gmail her

  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Kendra Konsole.

  2. Wählen Sie im linken Navigationsbereich Indizes und dann den Index, den Sie verwenden möchten, aus der Indexliste aus.

    Anmerkung

    Sie können Ihre Einstellungen für die Benutzerzugriffskontrolle unter Indexeinstellungen konfigurieren oder bearbeiten.

  3. Wählen Sie auf der Seite Erste Schritte die Option Datenquelle hinzufügen aus.

  4. Wählen Sie auf der Seite Datenquelle hinzufügen die Option Gmail-Connector und dann Connector hinzufügen aus. Wenn Sie Version 2 verwenden (falls zutreffend), wählen Sie den Gmail-Connector mit dem Tag „V2.0".

  5. Geben Sie auf der Seite „Datenquellendetails angeben“ die folgenden Informationen ein:

    1. Geben Sie im Feld Name und Beschreibung für Datenquellenname einen Namen für Ihre Datenquelle ein. Sie können Bindestriche, aber keine Leerzeichen verwenden.

    2. (Optional) Beschreibung — Geben Sie eine optionale Beschreibung für Ihre Datenquelle ein.

    3. In Standardsprache — Wählen Sie eine Sprache aus, um Ihre Dokumente nach dem Index zu filtern. Sofern Sie nichts anderes angeben, ist die Standardsprache Englisch. Die in den Metadaten des Dokuments angegebene Sprache hat Vorrang vor der ausgewählten Sprache.

    4. Unter Tags für Neues Tag hinzufügen — Fügen Sie optionale Tags hinzu, um Ihre Ressourcen zu durchsuchen und zu filtern oder Ihre Kosten nachzuverfolgen. AWS

    5. Wählen Sie Weiter aus.

  6. Geben Sie auf der Seite Zugriff und Sicherheit definieren die folgenden Informationen ein:

    1. Autorisierung — Aktivieren oder deaktivieren Sie die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, wenn Sie über eine ACL verfügen und diese für die Zugriffskontrolle verwenden möchten. Die ACL gibt an, auf welche Dokumente Benutzer und Gruppen zugreifen können. Die ACL-Informationen werden verwendet, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Weitere Informationen finden Sie unter Benutzerkontextfilterung.

    2. Unter Authentifizierung für AWS Secrets Manager geheime Daten — Wählen Sie ein vorhandenes Geheimnis aus, oder erstellen Sie ein neues Secrets Manager Geheimnis, um Ihre Gmail-Authentifizierungsdaten zu speichern. Wenn Sie sich dafür entscheiden, ein neues Geheimnis zu erstellen, wird ein AWS Secrets Manager geheimes Fenster geöffnet.

      1. Geben Sie die folgenden Informationen in das Fenster Create an AWS Secrets Manager Secret ein:

        1. Geheimer Name — Ein Name für Ihr Geheimnis.

        2. Kunden-E-Mail — Die Kunden-E-Mail, die Sie aus Ihrem Google-Dienstkonto kopiert haben.

        3. E-Mail-Adresse des Administratorkontos: Die E-Mail-Adresse des Administratorkontos, die Sie verwenden möchten.

        4. Privater Schlüssel — Der private Schlüssel, den Sie aus Ihrem Google-Dienstkonto kopiert haben.

        5. Speichern Sie Ihr Geheimnis und fügen Sie es hinzu.

    3. Virtual Private Cloud (VPC) — Sie können wählen, ob Sie eine VPC verwenden möchten. In diesem Fall müssen Sie Subnetze und VPC-Sicherheitsgruppen hinzufügen.

    4. IAM Rolle — Wählen Sie eine bestehende IAM Rolle oder erstellen Sie eine neue IAM Rolle, um auf Ihre Repository-Anmeldeinformationen und Indexinhalte zuzugreifen.

      Anmerkung

      IAM Rollen, die für Indizes verwendet werden, können nicht für Datenquellen verwendet werden. Wenn Sie sich nicht sicher sind, ob eine vorhandene Rolle für einen Index oder eine häufig gestellte Frage verwendet wird, wählen Sie Neue Rolle erstellen, um Fehler zu vermeiden.

    5. Wählen Sie Weiter aus.

  7. Geben Sie auf der Seite „Synchronisierungseinstellungen konfigurieren“ die folgenden Informationen ein:

    1. Für Entitätstypen — Wählen Sie aus, ob Nachrichtenanhänge synchronisiert werden sollen.

    2. (Optional) Geben Sie für Zusätzliche Konfiguration die folgenden Informationen ein:

      1. Datumsbereich — Geben Sie einen Datumsbereich ein, um das Start- und Enddatum der E-Mails anzugeben, die Sie crawlen möchten.

      2. E-Mail-Domänen — Schließen Sie bestimmte E-Mails auf der Grundlage der E-Mail-Domänen „An“, „Von“, „CC“ und „BCC“ ein oder aus.

      3. Schlüsselwörter in Betreffs — Schließen Sie E-Mails auf der Grundlage von Schlüsselwörtern in ihren E-Mail-Betreffs ein oder aus.

        Anmerkung

        Sie können sich auch dafür entscheiden, alle Dokumente einzubeziehen, die allen von Ihnen eingegebenen Betreff-Schlüsselwörtern entsprechen.

      4. Labels — Fügen Sie Muster für reguläre Ausdrücke hinzu, um bestimmte E-Mail-Labels ein- oder auszuschließen.

      5. Anlagen — Fügen Sie Muster für reguläre Ausdrücke hinzu, um bestimmte E-Mail-Anhänge ein- oder auszuschließen.

    3. Synchronisierungsmodus — Wählen Sie aus, wie Sie Ihren Index aktualisieren möchten, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen.

      • Vollständige Synchronisierung: Indizieren Sie den gesamten Inhalt neu und ersetzen die vorhandenen Inhalte jedes Mal, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.

      • Neue, geänderte, gelöschte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

      Wichtig

      Da es keine API zum Aktualisieren dauerhaft gelöschter Gmail-Nachrichten gibt, werden neue, geänderte oder gelöschte Inhalte synchronisiert:

      • Nachrichten, die dauerhaft aus Gmail gelöscht wurden, werden nicht aus Ihrem Amazon Kendra Index entfernt

      • Synchronisiert keine Änderungen an Gmail-E-Mail-Labels

      Um die Änderungen an den Labels Ihrer Gmail-Datenquelle und dauerhaft gelöschte E-Mail-Nachrichten mit Ihrem Amazon Kendra Index zu synchronisieren, müssen Sie regelmäßig vollständige Crawls ausführen.

    4. Wählen Sie im Zeitplan für die Synchronisierungsausführung unter Häufigkeit aus, wie oft Ihre Datenquelleninhalte synchronisiert und Ihr Index aktualisiert werden soll.

    5. Wählen Sie Weiter aus.

  8. Geben Sie auf der Seite Feldzuordnungen festlegen die folgenden Informationen ein:

    1. Standard-Datenquellenfelder — Wählen Sie eines der Amazon Kendra generierten Standard-Datenquellenfelder aus, die Sie Ihrem Index zuordnen möchten.

      Anmerkung

      Amazon Kendra Der Gmail-Datenquellen-Connector unterstützt die Erstellung von benutzerdefinierten Indexfeldern aufgrund von API-Einschränkungen nicht.

    2. Wählen Sie Weiter aus.

  9. Überprüfen Sie auf der Seite Überprüfen und erstellen, ob die von Ihnen eingegebenen Informationen korrekt sind, und wählen Sie dann Datenquelle hinzufügen aus. Sie können Ihre Informationen auch auf dieser Seite bearbeiten. Ihre Datenquelle wird auf der Seite Datenquellen angezeigt, nachdem die Datenquelle erfolgreich hinzugefügt wurde.

API

Um eine Verbindung Amazon Kendra zu Gmail herzustellen

Sie müssen mithilfe der TemplateConfigurationAPI einen JSON-Wert des Datenquellenschemas angeben. Sie müssen die folgenden Informationen angeben:

  • Datenquelle — Geben Sie den Datenquellentyp wie GMAIL bei der Verwendung des TemplateConfigurationJSON-Schemas an. Geben Sie außerdem die Datenquelle so anTEMPLATE, wie Sie die CreateDataSourceAPI aufrufen.

  • Synchronisierungsmodus — Geben Sie an, wie Ihr Index aktualisiert Amazon Kendra werden soll, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen. Sie können wählen zwischen:

    • FORCED_FULL_CRAWLum den gesamten Inhalt neu zu indizieren und vorhandene Inhalte jedes Mal zu ersetzen, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.

    • FULL_CRAWLum bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte zu indizieren. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

    Wichtig

    Da es keine API zum Aktualisieren dauerhaft gelöschter Gmail-Nachrichten gibt, werden neue, geänderte oder gelöschte Inhalte synchronisiert:

    • Nachrichten, die dauerhaft aus Gmail gelöscht wurden, werden nicht aus Ihrem Amazon Kendra Index entfernt

    • Synchronisiert keine Änderungen an Gmail-E-Mail-Labels

    Um die Änderungen an den Labels Ihrer Gmail-Datenquelle und dauerhaft gelöschte E-Mail-Nachrichten mit Ihrem Amazon Kendra Index zu synchronisieren, müssen Sie regelmäßig vollständige Crawls ausführen.

  • Geheimer Amazon-Ressourcenname (ARN) — Geben Sie den Amazon-Ressourcennamen (ARN) eines Secrets Manager Geheimnisses ein, das die Authentifizierungsdaten für Ihr Gmail-Konto enthält. Das Geheimnis wird in einer JSON-Struktur mit den folgenden Schlüsseln gespeichert:

    { "adminAccountEmailId": "service account email", "clientEmailId": "user account email", "privateKey": "private key" }
  • IAM role — Geben Sie anRoleArn, wann Sie anrufenCreateDataSource, um einer IAM Rolle Berechtigungen für den Zugriff auf Ihr Secrets Manager Geheimnis und den Aufruf der erforderlichen öffentlichen APIs für den Gmail-Connector und Amazon Kendra zu erteilen. Weitere Informationen finden Sie unter IAM Rollen für Gmail-Datenquellen.

Sie können auch die folgenden optionalen Funktionen hinzufügen:

  • Virtual Private Cloud (VPC) — Geben Sie an, VpcConfiguration wann Sie anrufen. CreateDataSource Weitere Informationen finden Sie unter Konfigurieren von Amazon Kendra für die Verwendung eines Amazon VPC.

  • Inklusions- und Ausschlussfilter — Geben Sie an, ob bestimmte „An“ -, „Von“ -, „CC“ - und „BCC“ -E-Mails ein- oder ausgeschlossen werden sollen.

    Anmerkung

    Die meisten Datenquellen verwenden Muster für reguläre Ausdrücke, bei denen es sich um Ein- oder Ausschlussmuster handelt, die als Filter bezeichnet werden. Wenn Sie einen Einschlussfilter angeben, werden nur Inhalte indexiert, die dem Einschlussfilter entsprechen. Jedes Dokument, das nicht dem Einschlussfilter entspricht, wird nicht indexiert. Wenn Sie einen Ein- und Ausschlussfilter angeben, werden Dokumente, die dem Ausschlussfilter entsprechen, nicht indexiert, auch wenn sie dem Einschlussfilter entsprechen.

  • Benutzerkontextfilterung und Zugriffskontrolle —Amazon Kendra durchsucht die Zugriffskontrollliste (ACL) für Ihre Dokumente, sofern Sie über eine ACL für Ihre Dokumente verfügen. Die ACL-Informationen werden verwendet, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Weitere Informationen finden Sie unter Benutzerkontextfilterung.

  • Feldzuordnungen — Wählen Sie aus, ob Sie Ihre Gmail-Datenquellenfelder Ihren Amazon Kendra Indexfeldern zuordnen möchten. Weitere Informationen finden Sie unter Zuweisen von Datenquellenfeldern.

    Anmerkung

    Das Textfeld oder das entsprechende Textfeld für Ihre Dokumente ist erforderlich, um Ihre Dokumente durchsuchen Amazon Kendra zu können. Sie müssen den Feldnamen Ihres Dokumenthauptteils in Ihrer Datenquelle dem Namen des Indexfeldes zuordnen_document_body. Alle anderen Felder sind optional.

    Anmerkung

    Amazon Kendra Der Gmail-Datenquellen-Connector unterstützt die Erstellung von benutzerdefinierten Indexfeldern aufgrund von API-Einschränkungen nicht.

Eine Liste weiterer wichtiger JSON-Schlüssel, die konfiguriert werden müssen, finden Sie unter GmailVorlagenschema.

Weitere Informationen

Weitere Informationen zur Integration Amazon Kendra mit Ihrer Gmail-Datenquelle finden Sie unter:

Hinweise

  • Da es keine API zum Aktualisieren dauerhaft gelöschter Gmail-Nachrichten gibt, erfolgt die Synchronisation mitFULL_CRAWL//Neue, geänderte oder gelöschte Inhalte:

    • Nachrichten, die dauerhaft aus Gmail gelöscht wurden, werden nicht aus Ihrem Amazon Kendra Index entfernt

    • Synchronisiert keine Änderungen an Gmail-E-Mail-Labels

    Um die Änderungen an den Labels Ihrer Gmail-Datenquelle und dauerhaft gelöschte E-Mail-Nachrichten mit Ihrem Amazon Kendra Index zu synchronisieren, müssen Sie regelmäßig vollständige Crawls ausführen.

  • Amazon Kendra Der Gmail-Datenquellen-Connector unterstützt die Erstellung von benutzerdefinierten Indexfeldern aufgrund von API-Einschränkungen nicht.