Datenquellenfelder zuordnen - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Datenquellenfelder zuordnen

Amazon Kendra Datenquellen-Konnektoren können Dokument- oder Inhaltsfelder aus Ihrer Datenquelle Feldern in Ihrem zuordnen Amazon Kendra Index. Standardmäßig ist jeder Connector so konzipiert, dass er bestimmte Datenquellenfelder crawlt. Standarddatenquellenfelder und ihre Eigenschaften können nicht geändert oder angepasst werden. Auf dem Amazon Kendra In der Konsole sind Standardfelder und Standardfeldeigenschaften, die nicht bearbeitet werden können, ausgegraut.

Amazon Kendra Mithilfe von Konnektoren können Sie auch benutzerdefinierte Dokument- oder Inhaltsfelder aus Ihrer Datenquelle benutzerdefinierten Feldern in Ihrem Index zuordnen. Wenn Sie in Ihrer Datenquelle beispielsweise ein Feld mit dem Namen „Abteilung“ haben, das Abteilungsinformationen für ein Dokument enthält, können Sie es einem Indexfeld namens „Abteilung“ zuordnen. Auf diese Weise können Sie das Feld bei der Abfrage von Dokumenten verwenden.

Sie können auch eine Karte erstellen Amazon Kendra reservierte oder gemeinsame Felder wie_created_at. Wenn Ihre Datenquelle ein Feld namens „creation_date“ hat, können Sie dieses dem entsprechenden Feld zuordnen Amazon Kendra reserviertes Feld aufgerufen. _created_at Weitere Informationen zu Amazon Kendra reservierte Felder, siehe Dokumentattribute oder Felder.

Sie können Felder für die meisten Datenquellen zuordnen. Sie können Feldzuordnungen für die folgenden Datenquellen erstellen:

  • Adobe Experience Manager

  • Alfresco

  • Aurora (MaiSQL)

  • Aurora (Postbote) SQL

  • Amazon FSx (Windows)

  • Amazon FSx (NetApp ONTAP)

  • Amazon RDS /Aurora

  • Amazon RDS (Microsoft SQL Server)

  • Amazon RDS (MeinSQL)

  • Amazon RDS (Orakel)

  • Amazon RDS (Postgret) SQL

  • Amazon Kendra Webcrawler

  • Amazon WorkDocs

  • Box (Kasten)

  • Confluence

  • Dropbox

  • Drupal

  • GitHub

  • Google Workspace-Laufwerke

  • Gmail

  • IBM DB2

  • Jira

  • Microsoft Exchange

  • Microsoft OneDrive

  • Microsoft SharePoint

  • Microsoft Teams

  • SQLMicrosoft-Server

  • Microsoft Yammer

  • Mein SQL

  • Oracle Database

  • Postgret SQL

  • Quip

  • Salesforce

  • ServiceNow

  • Slack

  • Zendesk

Wenn Sie Ihre Dokumente in einem S3-Bucket oder einer S3-Datenquelle speichern, geben Sie Ihre Felder mithilfe einer JSON Metadatendatei an. Weitere Informationen finden Sie unter S3-Datenquellenconnector.

Die Zuordnung Ihrer Datenquellenfelder zu einem Indexfeld erfolgt in drei Schritten:

  1. Erstellen Sie einen Index. Weitere Informationen finden Sie unter Index erstellen.

  2. Aktualisieren Sie den Index, um Felder hinzuzufügen.

  3. Erstellen Sie eine Datenquelle und fügen Sie Feldzuordnungen hinzu, um reservierte Felder und alle benutzerdefinierten Felder zuzuordnen Amazon Kendra Felder indexieren.

Um den Index zu aktualisieren und benutzerdefinierte Felder hinzuzufügen, bearbeiten Sie in der Konsole die Feldzuordnungen der Datenquellen und fügen Sie ein benutzerdefiniertes Feld hinzu, oder verwenden Sie den. UpdateIndexAPI Sie können Ihrem Index insgesamt 500 benutzerdefinierte Felder hinzufügen.

Wenn bei Datenbankdatenquellen der Name der Datenbankspalte mit dem Namen eines reservierten Felds übereinstimmt, werden das Feld und die Spalte automatisch zugeordnet.

Mit dem UpdateIndexAPIfügen Sie reservierte und benutzerdefinierte Felder hinzu mitDocumentMetadataConfigurationUpdates.

Im folgenden JSON Beispiel wird DocumentMetadataConfigurationUpdates ein Feld namens „Department“ zum Index hinzugefügt.

"DocumentmetadataConfigurationUpdates": [ { "Name": "Department", "Type": "STRING_VALUE" } ]

Wenn Sie das Feld erstellen, haben Sie die Möglichkeit festzulegen, wie das Feld für die Suche verwendet wird. Sie können aus den folgenden Optionen auswählen:

  • Anzeigbar — Bestimmt, ob das Feld in der Abfrageantwort zurückgegeben wird. Der Standardwert ist true.

  • Facetable — Gibt an, dass das Feld zur Erstellung von Facetten verwendet werden kann. Der Standardwert ist false.

  • Durchsuchbar — Bestimmt, ob das Feld bei der Suche verwendet wird. Die Standardeinstellung bei Zeichenfolgenfeldern ist true und bei Zahlen- und Datumsfeldern false.

  • Sortierbar — Gibt an, dass das Feld verwendet werden kann, um die Antwort aus einer Abfrage zu sortieren. Kann nur für Datums-, Zahlen- und Zeichenfolgenfelder festgelegt werden. Kann nicht für Zeichenkettenlistenfelder festgelegt werden.

Im folgenden JSON Beispiel wird dem DocumentMetadataConfigurationUpdates Index ein Feld mit dem Namen „Department“ hinzugefügt und es als facetable markiert.

"DocumentMetadataConfigurationUpdates": [ { "Name": "Department", "Type": "STRING_VALUE", "Search": { "Facetable": true } } ]

Die Verwendung von Amazon Kendra reservierte oder allgemeine Dokumentfelder

Mit dem UpdateIndex APIkönnen Sie reservierte oder allgemeine Felder erstellen, indem Sie die DocumentMetadataConfigurationUpdates Amazon Kendra reservierter Indexfeldname, der Ihrem entsprechenden Dokumentattribut/Feldnamen zugeordnet werden soll. Sie können auch benutzerdefinierte Felder erstellen. Wenn Sie einen Datenquellen-Konnektor verwenden, enthalten die meisten Feldzuordnungen, die die Felder Ihrer Datenquellendokumente zuordnen Amazon Kendra Indexfelder. Wenn Sie die Konsole verwenden, aktualisieren Sie Felder, indem Sie Ihre Datenquelle auswählen, die Aktion Bearbeiten auswählen und dann mit dem Abschnitt Feldzuordnungen zur Konfiguration der Datenquelle fortfahren.

Sie können das Search Objekt so konfigurieren, dass ein Feld entweder als anzeigbar, facettierbar, durchsuchbar oder sortierbar festgelegt wird. Sie können das Relevance Objekt so konfigurieren, dass die Rangfolge, die Boost-Dauer oder der Zeitraum eines Felds so festgelegt werden, dass sie auf Boosting, Aktualität, Wichtigkeitswert und Wichtigkeitswerte angewendet werden, die bestimmten Feldwerten zugeordnet sind. Wenn Sie die Konsole verwenden, können Sie die Sucheinstellungen für ein Feld festlegen, indem Sie im Navigationsmenü die Option Facette auswählen. Um die Relevanzoptimierung einzustellen, wählen Sie im Navigationsmenü die Option zum Durchsuchen Ihres Index aus, geben Sie eine Abfrage ein und verwenden Sie die Optionen im Seitenbereich, um die Suchrelevanz zu optimieren. Sie können den Feldtyp nicht mehr ändern, nachdem Sie das Feld erstellt haben.

Amazon Kendra hat die folgenden reservierten oder allgemeinen Dokumentfelder, die Sie verwenden können:

  • _authors—Eine Liste mit einem oder mehreren Autoren, die für den Inhalt des Dokuments verantwortlich sind.

  • _category— Eine Kategorie, die ein Dokument einer bestimmten Gruppe zuordnet.

  • _created_at— Datum und Uhrzeit im ISO 8601-Format, an dem das Dokument erstellt wurde. Beispielsweise ist 2012-03-25T 12:30:10 + 01:00 das ISO 8601-Datums-/Uhrzeitformat für den 25. März 2012 um 12:30 Uhr (plus 10 Sekunden) in mitteleuropäischer Zeit.

  • _data_source_id— Der Bezeichner der Datenquelle, die das Dokument enthält.

  • _document_body— Der Inhalt des Dokuments.

  • _document_id— Eine eindeutige Kennung für das Dokument.

  • _document_title— Der Titel des Dokuments.

  • _excerpt_page_number— Die Seitenzahl in einer PDF Datei, auf der der Dokumentauszug erscheint. Wenn Ihr Index vor dem 8. September 2020 erstellt wurde, müssen Sie Ihre Dokumente erneut indizieren, bevor Sie dieses Attribut verwenden können.

  • _faq_id— Wenn es sich um ein Dokument vom Typ Frage-Antwort (FAQ) handelt, eine eindeutige Kennung für. FAQ

  • _file_type— Der Dateityp des Dokuments, z. B. PDF oder Dokument.

  • _last_updated_at— Datum und Uhrzeit der letzten Aktualisierung des Dokuments im Format ISO 8601. Beispielsweise ist 2012-03-25T 12:30:10 + 01:00 das ISO 8601-Datums-/Uhrzeitformat für den 25. März 2012 um 12:30 Uhr (plus 10 Sekunden) in mitteleuropäischer Zeit.

  • _source_uriURI— Wo das Dokument verfügbar ist. Zum Beispiel das URI Dokument auf einer Unternehmenswebsite.

  • _version— Eine Kennung für die spezifische Version eines Dokuments.

  • _view_count— Wie oft das Dokument angesehen wurde.

  • _language_code(String) — Der Code für eine Sprache, die für das Dokument gilt. Dies ist standardmäßig Englisch, wenn Sie keine Sprache angeben. Weitere Informationen zu den unterstützten Sprachen, einschließlich ihrer Codes, finden Sie unter Dokumente in anderen Sprachen als Englisch hinzufügen.

Bei benutzerdefinierten Feldern erstellen Sie diese Felder DocumentMetadataConfigurationUpdates mit dem UpdateIndexAPI, genau wie bei der Erstellung eines reservierten oder gemeinsamen Felds. Sie müssen den entsprechenden Datentyp für Ihr benutzerdefiniertes Feld festlegen. Wenn Sie die Konsole verwenden, aktualisieren Sie Felder, indem Sie Ihre Datenquelle auswählen, die Aktion Bearbeiten auswählen und dann mit dem Abschnitt Feldzuordnungen zur Konfiguration der Datenquelle fortfahren. Einige Datenquellen unterstützen das Hinzufügen neuer Felder oder benutzerdefinierter Felder nicht. Sie können den Feldtyp nicht mehr ändern, nachdem Sie das Feld erstellt haben.

Die folgenden Typen können Sie für benutzerdefinierte Felder festlegen:

  • Datum

  • Zahl

  • String

  • Zeichenfolgenliste

Wenn Sie Dokumente mithilfe von BatchPutDocumentAPI, zum Index hinzugefügt haben, Attributes werden die Felder/Attribute Ihrer Dokumente aufgelistet und Sie erstellen Felder mithilfe des DocumentAttribute Objekts.

Für Dokumente, die aus einem indexiert wurden Amazon S3 Datenquelle: Sie erstellen Felder mithilfe einer JSONMetadatendatei, die die Feldinformationen enthält.

Wenn Sie eine unterstützte Datenbank als Datenquelle verwenden, können Sie Ihre Felder mithilfe der Option Feldzuordnungen konfigurieren.