Drupal - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Drupal

Drupal ist ein Open-Source-Content-Management-System (CMS), mit dem Sie Websites und Webanwendungen erstellen können. Sie können Folgendes verwenden Amazon Kendra , um in Drupal Folgendes zu indizieren:

  • Inhalt — Artikel, Standardseiten, Basisblöcke, Benutzerdefinierte Inhaltstypen, Benutzerdefinierte Blocktypen, Benutzerdefinierte Inhaltstypen, Benutzerdefinierte Blocktypen

  • Kommentar — Für jeden Inhaltstyp und Blocktyp

  • Anlagen — Für jeden Inhaltstyp und Blocktyp

Sie können über Amazon Kendra die Amazon Kendra Konsole oder die API eine Verbindung zu Ihrer Drupal-Datenquelle herstellen. TemplateConfiguration

Informationen zur Fehlerbehebung bei Ihrem Amazon Kendra Drupal-Datenquellen-Connector finden Sie unter. Problembehandlung bei Datenquellen

Unterstützte Features

Amazon Kendra Der Drupal-Datenquellen-Connector unterstützt die folgenden Funktionen:

  • Feldzuordnungen

  • Filterung des Benutzerkontextes

  • Einschluss-/Ausschlussfilter

  • Vollständige und inkrementelle Inhaltssynchronisierung

  • Virtual Private Cloud (VPC)

Voraussetzungen

Bevor Sie Ihre Drupal-Datenquelle Amazon Kendra zum Indizieren verwenden können, nehmen Sie diese Änderungen in Ihrem Drupal und Ihren Konten vor. AWS

Stellen Sie in Drupal sicher, dass Sie:

  • Sie haben ein Drupal (Standard) Suite-Konto und einen Benutzer mit Administratorrolle erstellt.

  • Der Name Ihrer Drupal-Site wurde kopiert und eine Host-URL konfiguriert. <drupalsitename>Zum Beispiel https:///<hostname>.

  • Konfigurierte Basisauthentifizierungsdaten, die einen Benutzernamen (Anmeldename für die Drupal-Website) und ein Passwort (Drupal-Website-Passwort) enthalten.

  • Empfohlen: Es wurde ein OAuth 2.0-Anmeldeinformationstoken konfiguriert. Verwenden Sie dieses Token zusammen mit Ihrem Drupal-Passwort, Ihrer Client-ID, Ihrem Kundengeheimnis, Ihrem Benutzernamen (Login-Benutzername für die Drupal-Website) und Ihrem Passwort (Drupal-Website-Passwort), um eine Verbindung herzustellen. Amazon Kendra

  • Mit einer Administratorrolle wurden Ihrem Drupal-Konto die folgenden Berechtigungen hinzugefügt:

    • Blöcke verwalten

    • block_content-Anzeige verwalten

    • block_content-Felder verwalten

    • die Block_Content-Formularanzeige verwalten

    • Ansichten verwalten

    • E-Mail-Adressen von Benutzern anzeigen

    • eigene unveröffentlichte Inhalte anzeigen

    • Seitenrevisionen ansehen

    • Artikelüberarbeitungen anzeigen

    • alle Überarbeitungen ansehen

    • das Administrationsdesign ansehen

    • auf Inhalte zugreifen

    • auf die Inhaltsübersicht zugreifen

    • auf Kommentare zugreifen

    • Inhalt suchen

    • Übersicht über Dateien aufrufen

    • auf kontextbezogene Links zugreifen

    Anmerkung

    Wenn es benutzerdefinierte Inhaltstypen oder benutzerdefinierte Blocktypen gibt oder Ansichten und Blöcke zur Drupal-Website hinzugefügt werden, müssen diese mit Administratorzugriff ausgestattet werden.

Stellen Sie sicher AWS-Konto, dass Sie in Ihrem haben:

  • Hat einen Amazon Kendra Index erstellt und bei Verwendung der API die Index-ID notiert.

  • Sie haben eine IAM Rolle für Ihre Datenquelle erstellt und, falls Sie die API verwenden, den ARN der IAM Rolle notiert.

    Anmerkung

    Wenn Sie Ihren Authentifizierungstyp und Ihre Anmeldeinformationen ändern, müssen Sie Ihre IAM Rolle aktualisieren, um auf die richtige AWS Secrets Manager geheime ID zugreifen zu können.

  • Haben Ihre Drupal-Authentifizierungsdaten AWS Secrets Manager geheim gespeichert und, falls Sie die API verwenden, den ARN des Geheimnisses notiert.

    Anmerkung

    Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihr Geheimnis regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.

Wenn Sie noch keine IAM Rolle oder keinen Schlüssel haben, können Sie die Konsole verwenden, um eine neue IAM Rolle und ein neues Secrets Manager Geheimnis zu erstellen, wenn Sie Ihre Drupal-Datenquelle mit verbinden. Amazon Kendra Wenn Sie die API verwenden, müssen Sie den ARN einer vorhandenen IAM Rolle und eines Secrets Manager Geheimnisses sowie eine Index-ID angeben.

Anweisungen zur Verbindung

Um eine Verbindung Amazon Kendra zu Ihrer Drupal-Datenquelle herzustellen, müssen Sie Details zu Ihren Drupal-Anmeldeinformationen angeben, damit Sie auf Ihre Daten zugreifen Amazon Kendra können. Wenn Sie Drupal noch nicht konfiguriert haben, finden Sie weitere Informationen. Amazon Kendra Voraussetzungen

Console

Um eine Verbindung zu Amazon Kendra Drupal herzustellen

  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Kendra Konsole.

  2. Wählen Sie im linken Navigationsbereich Indizes und dann den Index, den Sie verwenden möchten, aus der Indexliste aus.

    Anmerkung

    Sie können Ihre Einstellungen für die Benutzerzugriffskontrolle unter Indexeinstellungen konfigurieren oder bearbeiten.

  3. Wählen Sie auf der Seite Erste Schritte die Option Datenquelle hinzufügen aus.

  4. Wählen Sie auf der Seite Datenquelle hinzufügen die Option Drupal-Konnektor und dann Konnektor hinzufügen aus. Wenn Sie Version 2 verwenden (falls zutreffend), wählen Sie den Drupal-Connector mit dem Tag „V2.0".

  5. Geben Sie auf der Seite „Datenquellendetails angeben“ die folgenden Informationen ein:

    1. Geben Sie im Feld Name und Beschreibung für Datenquellenname einen Namen für Ihre Datenquelle ein. Sie können Bindestriche, aber keine Leerzeichen verwenden.

    2. (Optional) Beschreibung — Geben Sie eine optionale Beschreibung für Ihre Datenquelle ein.

    3. In Standardsprache — Wählen Sie eine Sprache aus, um Ihre Dokumente nach dem Index zu filtern. Sofern Sie nichts anderes angeben, ist die Standardsprache Englisch. Die in den Metadaten des Dokuments angegebene Sprache hat Vorrang vor der ausgewählten Sprache.

    4. Unter Tags für Neues Tag hinzufügen — Fügen Sie optionale Tags hinzu, um Ihre Ressourcen zu durchsuchen und zu filtern oder Ihre Kosten nachzuverfolgen. AWS

    5. Wählen Sie Weiter aus.

  6. Geben Sie auf der Seite Zugriff und Sicherheit definieren die folgenden Informationen ein:

    1. Im Feld Quelle für Host-URL — Die Host-URL Ihrer Drupal-Site. <drupalsitename>Zum Beispiel https:///<hostname>.

    2. Für den Speicherort des SSL-Zertifikats — Geben Sie den Pfad zu dem in Ihrem Amazon S3 Bucket gespeicherten SSL-Zertifikat ein.

    3. Autorisierung — Aktivieren oder deaktivieren Sie die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, wenn Sie über eine ACL verfügen und diese für die Zugriffskontrolle verwenden möchten. Die ACL gibt an, auf welche Dokumente Benutzer und Gruppen zugreifen können. Die ACL-Informationen werden verwendet, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Weitere Informationen finden Sie unter Benutzerkontextfilterung.

    4. Für Authentifizierung — Wählen Sie je nach Anwendungsfall zwischen Standardauthentifizierung und OAuth 2.0-Authentifizierung.

    5. AWS Secrets Manager geheim — Wählen Sie ein vorhandenes Geheimnis oder erstellen Sie ein neues Secrets Manager Geheimnis, um Ihre Drupal-Authentifizierungsdaten zu speichern. Wenn Sie ein neues Geheimnis erstellen möchten, wird ein AWS Secrets Manager geheimes Fenster geöffnet.

      1. Geben Sie die folgenden Informationen in das Fenster Create an AWS Secrets Manager Secret ein:

        1. Wenn Sie die Standardauthentifizierung gewählt haben, geben Sie einen geheimen Namen, den Benutzernamen (Drupal-Site-Benutzername) und das Passwort (Drupal-Site-Passwort) ein, die Sie kopiert haben, und wählen Sie Speichern und Geheimnis hinzufügen.

        2. Wenn Sie sich für die OAuth 2.0-Authentifizierung entschieden haben, geben Sie einen geheimen Namen, einen Benutzernamen (Drupal-Site-Benutzername), ein Passwort (Drupal-Site-Passwort), eine Client-ID und einen geheimen Client-Schlüssel ein, die in Ihrem Drupal-Konto generiert wurden, und wählen Sie Speichern und Geheimnis hinzufügen.

      2. Wählen Sie Speichern.

    6. Virtual Private Cloud (VPC) — Sie können wählen, ob Sie eine VPC verwenden möchten. In diesem Fall müssen Sie Subnetze und VPC-Sicherheitsgruppen hinzufügen.

    7. Identity Crawler — Geben Sie an, ob der Identity Crawler aktiviert Amazon Kendra werden soll. Der Identity Crawler verwendet die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Wenn Sie über eine ACL für Ihre Dokumente verfügen und Ihre ACL verwenden möchten, können Sie auch den Identity Crawler aktivieren, um die Benutzerkontextfilterung von Suchergebnissen zu konfigurieren. Amazon Kendra Andernfalls können alle Dokumente öffentlich durchsucht werden, wenn Identity Crawler ausgeschaltet ist. Wenn Sie die Zugriffskontrolle für Ihre Dokumente verwenden möchten und Identity Crawler ausgeschaltet ist, können Sie alternativ die PutPrincipalMappingAPI verwenden, um Benutzer- und Gruppenzugriffsinformationen für die Benutzerkontextfilterung hochzuladen.

    8. IAM Rolle — Wählen Sie eine bestehende IAM Rolle oder erstellen Sie eine neue IAM Rolle, um auf Ihre Repository-Anmeldeinformationen und Indexinhalte zuzugreifen.

      Anmerkung

      IAM Rollen, die für Indizes verwendet werden, können nicht für Datenquellen verwendet werden. Wenn Sie sich nicht sicher sind, ob eine vorhandene Rolle für einen Index oder eine häufig gestellte Frage verwendet wird, wählen Sie Neue Rolle erstellen, um Fehler zu vermeiden.

    9. Wählen Sie Weiter aus.

  7. Geben Sie auf der Seite Synchronisierungseinstellungen konfigurieren die folgenden Informationen ein:

    1. Wählen Sie für den Synchronisierungsbereich eine der folgenden Optionen aus:

      Anmerkung

      Wenn Sie Artikel, Standardseiten und Basisblöcke crawlen möchten, werden deren Standardfelder automatisch synchronisiert. Sie können sich auch dafür entscheiden, ihre Kommentare, Anlagen, benutzerdefinierten Felder und andere benutzerdefinierte Entitäten zu synchronisieren.

      1. Für ausgewählte Entitäten:

        • Artikel — Wählen Sie aus, ob Artikel, ihre Kommentare und ihre Anlagen gecrawlt werden sollen.

        • Standardseiten — Wählen Sie aus, ob Standardseiten, ihre Kommentare und ihre Anlagen gecrawlt werden sollen.

        • Standardblöcke — Wählen Sie aus, ob Standardblöcke, ihre Kommentare und ihre Anlagen gecrawlt werden sollen.

        • Sie können auch benutzerdefinierte Inhaltstypen und benutzerdefinierte Blöcke hinzufügen.

    2. Für zusätzliche Konfigurationen — optional:

      • Für Regex-Muster — Fügen Sie Muster für reguläre Ausdrücke hinzu, um bestimmte Entitätstitel und Dateinamen ein- oder auszuschließen. Sie können bis zu 100 Muster hinzufügen.

    3. Synchronisierungsmodus — Wählen Sie aus, wie Sie Ihren Index aktualisieren möchten, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen.

      • Vollständige Synchronisierung: Indizieren Sie den gesamten Inhalt neu und ersetzen die vorhandenen Inhalte jedes Mal, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.

      • Neue, geänderte, gelöschte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

    4. Im Zeitplan für die Synchronisierungsausführung, Häufigkeit — Wie oft Amazon Kendra die Synchronisierung mit Ihrer Datenquelle erfolgen soll.

    5. Wählen Sie Weiter aus.

  8. Geben Sie auf der Seite Feldzuordnungen festlegen die folgenden Informationen ein:

    1. Für Inhalte, Kommentare und Anlagen — Wählen Sie aus den Amazon Kendra generierten Standard-Datenquellenfeldern aus, die Sie Ihrem Index zuordnen möchten.

    2. Feld hinzufügen — Um benutzerdefinierte Datenquellenfelder hinzuzufügen, um einen Indexfeldnamen für die Zuordnung und den Felddatentyp zu erstellen.

    3. Wählen Sie Weiter aus.

  9. Überprüfen Sie auf der Seite Überprüfen und erstellen, ob die von Ihnen eingegebenen Informationen korrekt sind, und wählen Sie dann Datenquelle hinzufügen aus. Sie können Ihre Informationen auch auf dieser Seite bearbeiten. Ihre Datenquelle wird auf der Seite Datenquellen angezeigt, nachdem die Datenquelle erfolgreich hinzugefügt wurde.

API

Um eine Verbindung Amazon Kendra zu Drupal herzustellen

Sie müssen mithilfe der TemplateConfigurationAPI ein JSON des Datenquellenschemas angeben. Sie müssen die folgenden Informationen angeben:

  • Datenquelle — Geben Sie den Datenquellentyp wie DRUPAL bei der Verwendung des TemplateConfigurationJSON-Schemas an. Geben Sie außerdem die Datenquelle so anTEMPLATE, wie Sie die CreateDataSourceAPI aufrufen.

  • Synchronisierungsmodus — Geben Sie an, wie Ihr Index aktualisiert Amazon Kendra werden soll, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen. Sie können wählen zwischen:

    • FORCED_FULL_CRAWLum den gesamten Inhalt neu zu indizieren und vorhandene Inhalte jedes Mal zu ersetzen, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.

    • FULL_CRAWLum bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte zu indizieren. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

    • CHANGE_LOGum bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue und geänderte Inhalte zu indizieren. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

  • Geheimer Amazon-Ressourcenname (ARN) — Geben Sie den Amazon-Ressourcennamen (ARN) eines Secrets Manager Geheimnisses ein, das die Authentifizierungsdaten enthält, die Sie in Ihrem Drupal-Konto erstellt haben.

    Wenn Sie die Standardauthentifizierung verwenden, wird das Geheimnis in einer JSON-Struktur mit den folgenden Schlüsseln gespeichert:

    { "username": "user name", "password": "password" }

    Wenn Sie die OAuth 2.0-Authentifizierung verwenden, wird das Geheimnis in einer JSON-Struktur mit den folgenden Schlüsseln gespeichert:

    { "username": "user name", "password": "password", "clientId": "client id", "clientSecret": "client secret" }
    Anmerkung
    Anmerkung

    Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihr Geheimnis regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.

  • IAM Rolle — Geben Sie anRoleArn, wann Sie anrufenCreateDataSource, um einer IAM Rolle Berechtigungen für den Zugriff auf Ihr Secrets Manager Geheimnis und den Aufruf der erforderlichen öffentlichen APIs für den Drupal-Connector und zu erteilen. Amazon Kendra Weitere Informationen finden Sie unter IAM Rollen für Drupal-Datenquellen.

Sie können auch die folgenden optionalen Funktionen hinzufügen:

  • Virtual Private Cloud (VPC) — Geben Sie an, VpcConfiguration wann Sie anrufen. CreateDataSource Weitere Informationen finden Sie unter Konfigurieren Amazon Kendra um eine zu verwenden Amazon VPC.

  • Inklusions- und Ausschlussfilter — Sie können angeben, ob Inhalte, Kommentare und Anlagen eingeschlossen werden sollen. Sie können auch Muster für reguläre Ausdrücke angeben, um Inhalte, Kommentare und Anlagen ein- oder auszuschließen.

    Anmerkung

    Die meisten Datenquellen verwenden Muster für reguläre Ausdrücke, bei denen es sich um Ein- oder Ausschlussmuster handelt, die als Filter bezeichnet werden. Wenn Sie einen Einschlussfilter angeben, werden nur Inhalte indexiert, die dem Einschlussfilter entsprechen. Jedes Dokument, das nicht dem Einschlussfilter entspricht, wird nicht indexiert. Wenn Sie einen Ein- und Ausschlussfilter angeben, werden Dokumente, die dem Ausschlussfilter entsprechen, nicht indexiert, auch wenn sie dem Einschlussfilter entsprechen.

  • Identity Crawler — Geben Sie an, ob der Identity Crawler aktiviert Amazon Kendra werden soll. Der Identity Crawler verwendet die Informationen der Zugriffskontrollliste (ACL) für Ihre Dokumente, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Wenn Sie über eine ACL für Ihre Dokumente verfügen und Ihre ACL verwenden möchten, können Sie auch den Identity Crawler aktivieren, um die Benutzerkontextfilterung von Suchergebnissen zu konfigurieren. Amazon Kendra Andernfalls können alle Dokumente öffentlich durchsucht werden, wenn Identity Crawler ausgeschaltet ist. Wenn Sie die Zugriffskontrolle für Ihre Dokumente verwenden möchten und Identity Crawler ausgeschaltet ist, können Sie alternativ die PutPrincipalMappingAPI verwenden, um Benutzer- und Gruppenzugriffsinformationen für die Benutzerkontextfilterung hochzuladen.

  • Feldzuordnungen — Wählen Sie diese Option, um Ihre Drupal-Datenquellenfelder Ihren Indexfeldern zuzuordnen. Amazon Kendra Weitere Informationen finden Sie unter Zuweisen von Datenquellenfeldern.

    Anmerkung

    Das Textfeld oder das entsprechende Textfeld für Ihre Dokumente ist erforderlich, um Ihre Dokumente durchsuchen Amazon Kendra zu können. Sie müssen den Feldnamen Ihres Dokumenthauptteils in Ihrer Datenquelle dem Namen des Indexfeldes zuordnen_document_body. Alle anderen Felder sind optional.

Eine Liste weiterer wichtiger JSON-Schlüssel, die konfiguriert werden müssen, finden Sie unterDrupal-Vorlagenschema.

Hinweise

  • Drupal-APIs haben keine offiziellen Drosselungsgrenzen.

  • Java-SDKs sind für Drupal nicht verfügbar.

  • Drupal-Daten können nur mit nativen JSON-APIs abgerufen werden.

  • Inhaltstypen, die keiner Drupal-Ansicht zugeordnet sind, können nicht gecrawlt werden.

  • Sie benötigen Administratorzugriff, um Daten aus Drupal-Blöcken zu crawlen.

  • Es ist keine JSON-API verfügbar, um den benutzerdefinierten Inhaltstyp mithilfe von HTTP-Verben zu erstellen.

  • Der Dokumenttext und die Kommentare für Artikel, Standardseiten, Basisblöcke, den benutzerdefinierten Inhaltstyp und den benutzerdefinierten Blocktyp werden im HTML-Format angezeigt. Wenn der HTML-Inhalt nicht wohlgeformt ist, werden die HTML-bezogenen Tags im Hauptteil und in den Kommentaren des Dokuments angezeigt und sind in den Amazon Kendra Suchergebnissen sichtbar.

  • Inhaltstypen und Blocktypen ohne Beschreibung oder Hauptteil werden nicht übernommen. Amazon Kendra Nur Kommentare und Anlagen mit solchen Inhalts - oder Blocktypen werden in Ihren Amazon Kendra Index aufgenommen.