Beispiel für ein Artikel-Dataset-Schema (benutzerdefiniert)

Anforderungen an das Artikeldatensatz-Schema (benutzerdefiniert)

Ein Artikeldatensatz speichert Metadaten zu Ihren Artikeln in Ihrem Katalog. Dies kann Informationen wie Preis, Genre und Verfügbarkeit für jeden Artikel beinhalten. Informationen zu den Artikeldatentypen, die Sie in Amazon Personalize importieren können, finden Sie unterArtikel-Metadaten.

Die Daten, die Sie für jeden Artikel angeben, müssen Ihrem Artikeldatensatzschema entsprechen. Sie müssen mindestens eine Artikel-ID für jeden Artikel angeben (maximale Länge 256 Zeichen). Abhängig von Ihrem Schema können Elementmetadaten empty/null Werte enthalten. Ihr Schema muss mindestens ein Metadatenfeld enthalten. Wenn Sie jedoch einen null Typ hinzufügen, kann dieser Wert für das Element Null sein. Es steht Ihnen frei, je nach Ihrem Anwendungsfall und Ihren Daten weitere Felder hinzuzufügen. Solange die Felder nicht als erforderlich oder reserviert aufgeführt sind und die Datentypen unter aufgeführt sindSchema-Datentypen, liegen die Feldnamen und Datentypen bei Ihnen.

Um kategoriale Daten zu verwenden, fügen Sie ein Feld vom Typ hinzu string und legen Sie das kategoriale Attribut des Felds true in Ihrem Schema auf fest. Nehmen Sie dann die kategorialen Daten in Ihre CSV-Massendatei und die Importe einzelner Artikel auf. Kategoriewerte können maximal 1000 Zeichen lang sein. Wenn Sie ein Element mit einem kategorialen Wert mit mehr als 1000 Zeichen haben, schlägt Ihr Datensatz-Importjob fehl.

Bei Elementen mit mehreren Kategorien trennen Sie die einzelnen Werte durch den senkrechten Balken '|' voneinander. Für ein GENRES-Feld könnten Ihre Daten für ein Element beispielsweise Action|Crime|Biopic Wenn Sie über mehrere Ebenen von kategorialen Daten verfügen und einige Elemente mehrere Kategorien für jede Ebene in der Hierarchie haben, fügen Sie für jede Ebene ein Feld hinzu und fügen Sie hinter jedem Feldnamen einen Ebenenindikator an: GENRES, GENRE_L2, GENRE_L3. Auf diese Weise können Sie Empfehlungen auf der Grundlage von Unterkategorien filtern, auch wenn ein Element zu mehreren Kategorien mit mehreren Ebenen gehört (Informationen zum Erstellen und Verwenden von Filtern finden Sie unter). Empfehlungen und Benutzersegmente filtern Ein Video könnte beispielsweise die folgenden Daten für jede Kategorieebene enthalten:

GENRES: Aktion | Abenteuer
GENRE_L2: Krimi | Western
GENRE_L3: Biopic

In diesem Beispiel handelt es sich bei dem Video um Action > Verbrechen > Biopic-Hierarchie und Abenteuer > Western > Biopic-Hierarchie. Wir empfehlen, nur bis zu L3 zu verwenden, aber Sie können bei Bedarf auch mehr Stufen verwenden.

Während der Modellschulung berücksichtigt Amazon Personalize maximal 750.000 Artikel. Wenn Sie mehr als 750.000 Artikel importieren, entscheidet Amazon Personalize, welche Artikel in die Schulung aufgenommen werden sollen, wobei der Schwerpunkt auf der Aufnahme neuer Artikel (Artikel, die Sie kürzlich ohne Interaktionen hinzugefügt haben) und vorhandener Artikel mit Daten zu aktuellen Interaktionen liegt.

Weitere Informationen zu Mindestanforderungen und maximalen Datenlimits für einen Artikeldatensatz finden Sie unter. Servicekontingente

Beispiel für ein Artikel-Dataset-Schema (benutzerdefiniert)

Das folgende Beispiel zeigt, wie ein Artikelschema strukturiert wird. Das Feld ITEM_ID ist ein Pflichtfeld. Das GENRE Feld besteht aus kategorialen Metadaten und das DESCRIPTION Feld besteht aus textuellen Metadaten. Es ist mindestens ein Metadatenfeld erforderlich. Sie können maximal 100 Metadatenfelder hinzufügen. Das CREATION_TIMESTAMP Feld ist ein reserviertes Schlüsselwort. Hinweise zu Schemaanforderungen finden Sie unterAnforderungen an benutzerdefinierte Datensätze und Schemas.


{
  "type": "record",
  "name": "Items",
  "namespace": "com.amazonaws.personalize.schema",
  "fields": [
    {
      "name": "ITEM_ID",
      "type": "string"
    },
    {
      "name": "GENRES",
      "type": [
        "null",
        "string"
      ],
      "categorical": true
    },
    {
      "name": "CREATION_TIMESTAMP",
      "type": "long"
    },
    {
      "name": "DESCRIPTION",
      "type": [
        "null",
        "string"
      ],
      "textual": true
    }
  ],
  "version": "1.0"
}

Für dieses Schema könnten die ersten Zeilen mit historischen Daten in einer CSV-Datei wie folgt aussehen.


ITEM_ID,GENRES,CREATION_TIMESTAMP,DESCRIPTION
1,Adventure|Animation|Children|Comedy|Fantasy,1570003267,"This is an animated movie that features action, comedy, and fantasy. Audience is children. This movie was released in 2004."
2,Adventure|Children|Fantasy,1571730101,"This is an adventure movie with elements of fantasy. Audience is children. This movie was release in 2010."
3,Comedy|Romance,1560515629,"This is a romantic comedy. The movie was released in 1999. Audience is young women."
4,Comedy|Drama|Romance,1581670067,"This movie includes elements of both comedy and drama as well as romance. This movie was released in 2020."
...
...

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Anforderungen an das Datensatz-Schema für Benutzer

Anforderungen an das Aktions-Dataset-Schema