Index - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Index

Ein Index enthält den Inhalt Ihrer Dokumente und ist so strukturiert, dass die Dokumente durchsuchbar sind. Wie Sie Dokumente zum Index hinzufügen, hängt davon ab, wie Sie Ihre Dokumente speichern.

  • Wenn Sie Ihre Dokumente in einer Art von Repository speichern, z. B. in Amazon S3 Bucket oder eine SharePoint Microsoft-Site, Sie verwenden einen Datenquellen-Connector, um Ihre Dokumente aus Ihrem Repository zu indizieren.

  • Wenn Sie Ihre Dokumente nicht in einem Repository speichern, verwenden Sie den, BatchPutDocumentAPIum Ihre Dokumente direkt zu indizieren.

  • Für FAQ Fragen und Antworten, die in einem gespeichert werden müssen Amazon Kendra (Amazon S3) Bucket, du lädst sie aus dem Bucket hoch

Sie können Indizes erstellen mit Amazon Kendra Konsole, die AWS CLI, oder ein AWS SDK. Informationen zu den Dokumenttypen, die indexiert werden können, finden Sie unter Dokumenttypen.

Die Verwendung von Amazon Kendra reservierte oder allgemeine Dokumentfelder

Mit dem UpdateIndex APIkönnen Sie reservierte oder allgemeine Felder erstellen, indem Sie die DocumentMetadataConfigurationUpdates Amazon Kendra reservierter Indexfeldname, der Ihrem entsprechenden Dokumentattribut/Feldnamen zugeordnet werden soll. Sie können auch benutzerdefinierte Felder erstellen. Wenn Sie einen Datenquellen-Konnektor verwenden, enthalten die meisten Feldzuordnungen, mit denen die Felder Ihres Datenquellendokuments zugeordnet werden Amazon Kendra Felder indizieren. Wenn Sie die Konsole verwenden, aktualisieren Sie Felder, indem Sie Ihre Datenquelle auswählen, die Aktion Bearbeiten auswählen und dann mit dem Abschnitt Feldzuordnungen zur Konfiguration der Datenquelle fortfahren.

Sie können das Search Objekt so konfigurieren, dass ein Feld entweder als anzeigbar, facettierbar, durchsuchbar oder sortierbar festgelegt wird. Sie können das Relevance Objekt so konfigurieren, dass die Rangfolge, die Boost-Dauer oder der Zeitraum eines Felds so festgelegt werden, dass sie auf Boosting, Aktualität, Wichtigkeitswert und Wichtigkeitswerte angewendet werden, die bestimmten Feldwerten zugeordnet sind. Wenn Sie die Konsole verwenden, können Sie die Sucheinstellungen für ein Feld festlegen, indem Sie im Navigationsmenü die Option Facette auswählen. Um die Relevanzoptimierung einzustellen, wählen Sie im Navigationsmenü die Option zum Durchsuchen Ihres Index aus, geben Sie eine Abfrage ein und verwenden Sie die Optionen im Seitenbereich, um die Suchrelevanz zu optimieren. Sie können den Feldtyp nicht mehr ändern, nachdem Sie das Feld erstellt haben.

Amazon Kendra hat die folgenden reservierten oder allgemeinen Dokumentfelder, die Sie verwenden können:

  • _authors—Eine Liste mit einem oder mehreren Autoren, die für den Inhalt des Dokuments verantwortlich sind.

  • _category— Eine Kategorie, die ein Dokument einer bestimmten Gruppe zuordnet.

  • _created_at— Datum und Uhrzeit im ISO 8601-Format, an dem das Dokument erstellt wurde. Beispielsweise ist 2012-03-25T 12:30:10 + 01:00 das ISO 8601-Datums-/Uhrzeitformat für den 25. März 2012 um 12:30 Uhr (plus 10 Sekunden) in mitteleuropäischer Zeit.

  • _data_source_id— Der Bezeichner der Datenquelle, die das Dokument enthält.

  • _document_body— Der Inhalt des Dokuments.

  • _document_id— Eine eindeutige Kennung für das Dokument.

  • _document_title— Der Titel des Dokuments.

  • _excerpt_page_number— Die Seitenzahl in einer PDF Datei, auf der der Dokumentauszug erscheint. Wenn Ihr Index vor dem 8. September 2020 erstellt wurde, müssen Sie Ihre Dokumente erneut indizieren, bevor Sie dieses Attribut verwenden können.

  • _faq_id— Wenn es sich um ein Dokument vom Typ Frage-Antwort (FAQ) handelt, eine eindeutige Kennung für. FAQ

  • _file_type— Der Dateityp des Dokuments, z. B. PDF oder Dokument.

  • _last_updated_at— Datum und Uhrzeit der letzten Aktualisierung des Dokuments im Format ISO 8601. Beispielsweise ist 2012-03-25T 12:30:10 + 01:00 das ISO 8601-Datums-/Uhrzeitformat für den 25. März 2012 um 12:30 Uhr (plus 10 Sekunden) in mitteleuropäischer Zeit.

  • _source_uriURI— Wo das Dokument verfügbar ist. Zum Beispiel das URI Dokument auf einer Unternehmenswebsite.

  • _version— Ein Bezeichner für die spezifische Version eines Dokuments.

  • _view_count— Wie oft das Dokument angesehen wurde.

  • _language_code(String) — Der Code für eine Sprache, die für das Dokument gilt. Dies ist standardmäßig Englisch, wenn Sie keine Sprache angeben. Weitere Informationen zu den unterstützten Sprachen, einschließlich ihrer Codes, finden Sie unter Dokumente in anderen Sprachen als Englisch hinzufügen.

Bei benutzerdefinierten Feldern erstellen Sie diese Felder DocumentMetadataConfigurationUpdates mit dem UpdateIndexAPI, genauso wie Sie es bei der Erstellung eines reservierten oder gemeinsamen Felds tun. Sie müssen den entsprechenden Datentyp für Ihr benutzerdefiniertes Feld festlegen. Wenn Sie die Konsole verwenden, aktualisieren Sie Felder, indem Sie Ihre Datenquelle auswählen, die Aktion Bearbeiten auswählen und dann mit dem Abschnitt Feldzuordnungen zur Konfiguration der Datenquelle fortfahren. Einige Datenquellen unterstützen das Hinzufügen neuer Felder oder benutzerdefinierter Felder nicht. Sie können den Feldtyp nicht mehr ändern, nachdem Sie das Feld erstellt haben.

Die folgenden Typen können Sie für benutzerdefinierte Felder festlegen:

  • Datum

  • Zahl

  • String

  • Zeichenfolgenliste

Wenn Sie Dokumente mithilfe von BatchPutDocumentAPI, zum Index hinzugefügt haben, Attributes werden die Felder/Attribute Ihrer Dokumente aufgelistet und Sie erstellen Felder mithilfe des DocumentAttribute Objekts.

Für Dokumente, die aus einem indexiert wurden Amazon S3 Datenquelle: Sie erstellen Felder mithilfe einer JSONMetadatendatei, die die Feldinformationen enthält.

Wenn Sie eine unterstützte Datenbank als Datenquelle verwenden, können Sie Ihre Felder mithilfe der Option Feldzuordnungen konfigurieren.

Indizes durchsuchen

Nachdem Sie einen Index erstellt haben, können Sie mit der Suche in Ihren Dokumenten beginnen. Weitere Informationen finden Sie unter Indizes durchsuchen.