Schemata - Amazon Personalize

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Schemata

Ein Schema informiert Amazon Personalize über die Struktur Ihrer Daten und ermöglicht Amazon Personalize, die Daten zu analysieren. Ein Schema hat einen Namensschlüssel, dessen Wert dem Datensatztyp entsprechen muss. Nachdem Sie ein Schema erstellt haben, können Sie keine Änderungen am Schema vornehmen.

Für Domain-Datensatzgruppen hat jeder Datensatztyp ein Standardschema mit erforderlichen Feldern und reservierten Schlüsselwörtern. Jedes Mal, wenn Sie einen Datensatz erstellen, können Sie entweder das vorhandene Domänenschema verwenden oder ein neues erstellen, indem Sie das vorhandene Standardschema ändern. Verwenden Sie das Standardschema als Leitfaden dafür, welche Daten für Ihre Domain importiert werden sollen. Sobald Sie das Schema definiert und den Datensatz erstellt haben, können Sie keine Änderungen am Schema vornehmen.

Anforderungen an die Schemaformatierung

Wenn Sie ein Schema für einen Datensatz in einer Domain-Datensatzgruppe oder einer benutzerdefinierten Datensatzgruppe erstellen, müssen Sie die folgenden Richtlinien beachten:

  • Sie müssen das Schema im Avro-Format definieren. Informationen zu den Avro-Datentypen, die wir unterstützen, finden Sie unter. Schema-Datentypen

  • Die Schemafelder können in beliebiger Reihenfolge angezeigt werden, müssen jedoch der Reihenfolge der entsprechenden Spaltenüberschriften in Ihrer CSV-Datei entsprechen.

  • Bei Schemas muss es sich um flache JSON-Dateien ohne verschachtelte Strukturen handeln. Beispielsweise kann ein Feld nicht mehreren Unterfeldern übergeordnet sein.

  • Amazon Personalize Personalize-Schemas unterstützen keine komplexen Typen wie Arrays und Maps.

  • Schemafelder müssen eindeutige alphanumerische Namen haben. Sie können beispielsweise nicht gleichzeitig ein GENRES_FIELD_1 Feld und ein GENRESFIELD1 Feld hinzufügen.

  • Sie müssen Pflichtfelder als ihre erforderlichen Datentypen definieren. Für reservierte kategoriale Zeichenfolgenfelder muss das categorical Attribut auf gesetzt seintrue, während reservierte Zeichenkettenfelder nicht kategorisch sein können. Die Schlüsselwörter dürfen nicht in Ihren Daten enthalten sein.

  • Wenn Sie Ihr eigenes Metadatenfeld vom Typ hinzufügen string und möchten, dass Amazon Personalize es beim Training verwendet, muss es das categorical Attribut oder das textual Attribut enthalten (nur Artikelschemas unterstützen Felder mit dem Textattribut).

  • Amazon Personalize kann beim Generieren von Themen, beim Zurückgeben von Metadaten in Empfehlungen und beim Filtern von Empfehlungen unkategorische Zeichenfolgenspalten verwenden, z. B. Spalten mit Artikelnamen. Weitere Informationen finden Sie unter Nicht kategorische Zeichenkettendaten.

  • Amazon Personalize verwendet beim Trainieren oder Filtern von Empfehlungen keine boolean Typdaten. Damit Amazon Personalize beim Training oder Filtern boolesche Daten verwendet, verwenden Sie ein Feld vom Typ String und verwenden Sie die Werte "True" und "False" in Ihren Daten. Oder Sie können den Typ int oder long und die Werte und verwenden. 0 1

  • Textfelder müssen vom Typ sein string und das textual Attribut muss auf gesetzt seintrue. Weitere Hinweise zu unstrukturierten Textdaten finden Sie unter. Unstrukturierte Textmetadaten

Für Datensätze mit Domänen-Datensatzgruppen gelten zusätzliche Anforderungen, die sowohl auf der Domäne als auch auf dem Datensatztyp basieren. Für Datensätze mit benutzerdefinierten Datensatzgruppen gelten je nach Typ zusätzliche Anforderungen.

Schema-Datentypen

Amazon Personalize Personalize-Schemas unterstützen die folgenden Avro-Typen für Felder:

  • float

  • double

  • int

  • long

  • Zeichenfolge

  • Boolesch

  • Null

Einige erforderliche und reservierte Felder unterstützen Nulldaten. Wenn Sie einem Feld einen null Typ hinzufügen, können Sie unvollständige Daten (z. B. Metadaten mit leeren Werten) verwenden, um Empfehlungen zu generieren. Informationen darüber, welche Felder Nulldaten unterstützen, finden Sie unter Domain-Datasets und Schemas oderBenutzerdefinierte Datensätze und Schemas. Das folgende Beispiel zeigt, wie ein Nulltyp für ein GENDER-Feld hinzugefügt wird.

{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }