Requisiti dello schema del set di dati degli elementi (personalizzati) - Amazon Personalize

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Requisiti dello schema del set di dati degli elementi (personalizzati)

Un set di dati Items memorizza i metadati relativi ai tuoi articoli nel tuo catalogo. Ciò potrebbe includere informazioni come prezzo, genere e disponibilità per ogni articolo. Per informazioni sui tipi di dati sugli articoli che puoi importare in Amazon Personalize, consulta. Set di dati degli elementi

I dati forniti per ogni articolo devono corrispondere allo schema del set di dati Items. Come minimo, devi fornire un ID articolo per ogni articolo (lunghezza massima 256 caratteri). A seconda dello schema, i metadati degli elementi possono includere valori vuoti/nulli. Lo schema deve avere almeno un campo di metadati, ma se aggiungi un null tipo, questo valore può essere nullo per l'elemento. Sei libero di aggiungere campi aggiuntivi a seconda del tuo caso d'uso e dei tuoi dati. Finché i campi non sono elencati come obbligatori o riservati e i tipi di dati sono elencatiTipi di dati dello schema, i nomi dei campi e i tipi di dati sono a tua discrezione.

Per utilizzare dati categorici, aggiungi un campo di tipo string e imposta l'attributo categorico del campo su true nel tuo schema. Quindi includi i dati categorici nel tuo file CSV di massa e nelle importazioni di singoli articoli. I valori categoriali possono contenere al massimo 1000 caratteri. Se hai un elemento con un valore categorico con più di 1000 caratteri, il processo di importazione del set di dati avrà esito negativo.

Per gli elementi con più categorie, separa ogni valore con la barra verticale '|'. Ad esempio, per un campo GENRES i tuoi dati per un elemento potrebbero essere. Action|Crime|Biopic Se disponi di più livelli di dati categoriali e alcuni elementi hanno più categorie per ogni livello della gerarchia, aggiungi un campo per ogni livello e aggiungi un indicatore di livello dopo ogni nome di campo: GENRES, GENRE_L2, GENRE_L3. In questo modo puoi filtrare i consigli in base alle sottocategorie, anche se un elemento appartiene a più categorie a più livelli (per informazioni sulla creazione e l'utilizzo dei filtri, vedi). Suggerimenti di filtraggio e segmenti di utenti Ad esempio, un video potrebbe contenere i seguenti dati per ogni livello di categoria:

  • GENERI: Azione|Avventura

  • GENERE_L2: Crimine|Western

  • GENERE_L3: Biopic

In questo esempio, il video si trova nella gerarchia azione > crimine > biopic e nella gerarchia avventura > western > biopic. Si consiglia di utilizzare solo fino a L3, ma è possibile utilizzare più livelli se necessario.

Durante la formazione sui modelli, Amazon Personalize considera un massimo di 750.000 articoli. Se importi più di 750.000 articoli, Amazon Personalize decide quali elementi includere nella formazione, con particolare attenzione all'inclusione di nuovi articoli (elementi aggiunti di recente senza interazioni) e articoli esistenti con dati sulle interazioni recenti.

Per ulteriori informazioni sui requisiti minimi e sui limiti massimi di dati per un set di dati Items, consulta. Quote del servizio

Esempio di schema del set di dati Items (personalizzato)

L'esempio seguente mostra come strutturare uno schema Items. Il campo ITEM_ID è obbligatorio. Il GENRE campo è costituito da metadati categorici e il DESCRIPTION campo è da metadati testuali. È richiesto almeno un campo di metadati. Puoi aggiungere un massimo di 100 campi di metadati. Il CREATION_TIMESTAMP campo è una parola chiave riservata. Per informazioni sui requisiti dello schema, vedereRequisiti per set di dati e schemi personalizzati.

{ "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "GENRES", "type": [ "null", "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" }, { "name": "DESCRIPTION", "type": [ "null", "string" ], "textual": true } ], "version": "1.0" }

Per questo schema, le prime righe di dati storici in un file CSV potrebbero avere l'aspetto seguente.

ITEM_ID,GENRES,CREATION_TIMESTAMP,DESCRIPTION 1,Adventure|Animation|Children|Comedy|Fantasy,1570003267,"This is an animated movie that features action, comedy, and fantasy. Audience is children. This movie was released in 2004." 2,Adventure|Children|Fantasy,1571730101,"This is an adventure movie with elements of fantasy. Audience is children. This movie was release in 2010." 3,Comedy|Romance,1560515629,"This is a romantic comedy. The movie was released in 1999. Audience is young women." 4,Comedy|Drama|Romance,1581670067,"This movie includes elements of both comedy and drama as well as romance. This movie was released in 2020." ... ...