Ensembles de données et schémas personnalisés - Amazon Personalize

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Ensembles de données et schémas personnalisés

Lorsque vous créez un groupe de jeux de données personnalisé, vous créez vos propres schémas à partir de zéro. Les ensembles de données et les schémas de groupes de jeux de données personnalisés comportent moins de champs obligatoires et offrent une plus grande flexibilité. Les rubriques suivantes expliquent le schéma et les exigences en matière de données pour les ensembles de données d'un groupe de jeux de données personnalisé. Chaque section du jeu de données répertorie les données requises pour le type d'ensemble de données et fournit un exemple de schéma JSON.

Pour plus d'informations sur les types de données que vous pouvez importer dans Amazon Personalize, consultezJeux de données. Pour plus d'informations sur les exigences générales du schéma Amazon Personalize, telles que les exigences de mise en forme et les types de données de champ disponibles, consultezSchémas. Ces exigences s'appliquent à tous les schémas Amazon Personalize.

Exigences relatives aux ensembles de données et aux schémas personnalisés

Lorsque vous créez un ensemble de données pour un groupe de jeux de données personnalisé, chaque type de jeu de données comporte les champs obligatoires et les mots clés réservés suivants avec les types de données requis.

Type d'ensemble de données Champs obligatoires Mots-clés réservés
Interactions entre éléments (exemple de schéma)

USER_ID (string)

ITEM_ID (string)

TIMESTAMP (long)

EVENT_TYPE (string)

VALEUR_ÉVÉNEMENT (,) float null

IMPRESSION (string,null)

IDENTIFIANT DE RECOMMANDATION (,) string null

SOURCE D'ATTRIBUTION DE L'ÉVÉNEMENT (,) string null

Utilisateurs (exemple de schéma)

USER_ID (string)

1 champ de métadonnées (catégorique string ou numérique)

Éléments (exemple de schéma)

ITEM_ID (string)

1 champ de métadonnées (champ catégorique ou textuel ou string champ numérique)

HORODATAGE DE CRÉATION () long

Actions (exemple de schéma)

IDENTIFIANT DE L'ACTION () string

1 champ de métadonnées (catégorique string ou numérique)

HORODATAGE DE CRÉATION () long

VALEUR (long,null)

TAPEZ (string,null)

HORODATAGE D'EXPIRATION (,) long null

FRÉQUENCE DE RÉPÉTITION (,) long null

Interactions entre actions (exemple de schéma)

USER_ID (string)

IDENTIFIANT DE L'ACTION () string

EVENT_TYPE (string)

TIMESTAMP (long)

IMPRESSION (string,null)

IDENTIFIANT DE RECOMMANDATION (,) string null

Champs de métadonnées

Les métadonnées incluent des champs sous forme de chaîne ou non sous forme de chaîne qui ne sont pas obligatoires ou qui n'utilisent pas de mot clé réservé. Les schémas de métadonnées sont soumis aux restrictions suivantes :

  • Les schémas d'utilisateurs, d'éléments et d'actions nécessitent au moins un champ de métadonnées.

  • Vous pouvez ajouter au maximum 25 champs de métadonnées pour un schéma Users, 100 champs de métadonnées pour un schéma Items et 10 champs de métadonnées pour un schéma Actions.

  • Si vous ajoutez votre propre champ de métadonnées de typestring, il doit inclure l'categoricalattribut ou l'textualattribut (seuls les schémas Items prennent en charge les champs avec l'attribut textuel). Sinon, Amazon Personalize n'utilisera pas le champ lors de la formation d'un modèle.

Mots-clés réservés

Les mots clés réservés sont des champs facultatifs qui ne sont pas des champs de métadonnées. Ces champs sont considérés comme réservés car vous devez définir les champs comme leur type de données obligatoire lorsque vous les utilisez, et les mots clés ne peuvent pas être utilisés comme valeurs dans vos données. Les champs de chaîne catégorielle réservés doivent être categorical définis surtrue, tandis que les champs de chaîne réservés ne peuvent pas être catégoriques. Les mots clés suivants sont réservés :

  • EVENT_TYPE : pour les ensembles de données d'interactions entre éléments comportant un ou plusieurs types d'événements, tels que le clic et le téléchargement, utilisez un champ. EVENT_TYPE Vous devez définir un champ EVENT_TYPE comme un string et ne pouvez pas être défini comme catégorique.

  • EVENT_VALUE : pour les ensembles de données d'interactions entre éléments qui incluent des données de valeur relatives à des événements, telles que le pourcentage d'une vidéo regardée par un utilisateur, utilisez un EVENT_VALUE champ avec un type float et éventuellement un champ. null

  • CREATION_TIMESTAMP : pour les ensembles de données d'éléments ou d'actions avec un horodatage pour la date de création de chaque élément, utilisez un champ avec un type. CREATION_TIMESTAMP long Amazon Personalize utilise CREATION_TIMESTAMP les données pour calculer l'âge d'un article et ajuster les recommandations en conséquence. veuillez consulter Données d'horodatage de création.

  • IMPRESSION : Pour les ensembles de données d'interactions entre articles contenant des données d'impressions explicites, utilisez un IMPRESSION champ avec un type String et éventuellement un typenull. Les impressions sont des listes d'éléments visibles par un utilisateur lorsqu'il interagissait avec un élément en particulier (par exemple, en cliquant ou en regardant). Pour plus d’informations, consultez Données sur les impressions.

  • RECOMMENDATION_ID : pour les ensembles de données d'interactions entre articles qui utilisent les recommandations précédentes comme données d'impressions implicites, utilisez éventuellement un RECOMMENDATION_ID champ avec type et éventuellement typeString. null

    Il n'est pas nécessaire d'ajouter un RECOMMENDATION_ID champ pour qu'Amazon Personalize utilise les impressions implicites lors de la génération de recommandations. Vous pouvez réussir recommendationId une PutEvents opération sans elle. Pour plus d’informations, consultez Données sur les impressions.

  • VALEUR : pour les ensembles de données Actions, si vous disposez de données de valeur pour certaines ou toutes vos actions, ajoutez un VALUE champ à votre schéma. Pour son type, utilisez long et tapez éventuellementnull. Pour plus d'informations sur les actions et leur valeur, consultezDonnées de valeur.

  • ACTION_EXPIRATION_TIMESTAMP : pour les ensembles de données Actions, si vous avez un horodatage d'expiration pour certaines ou toutes vos actions, ajoutez un champ à votre schéma. ACTION_EXPIRATION_TIMESTAMP Pour son type, utilisez long et tapez éventuellementnull. Pour plus d'informations sur les horodatages d'expiration, consultez. Données d'horodatage d'expiration des actions

  • REPEAT_FREQUENCY : pour les ensembles de données Actions, si vous disposez de données de fréquence de répétition pour certaines ou toutes vos actions, ajoutez un REPEAT_FREQUENCY champ à votre schéma. Pour son type, utilisez long et tapez éventuellementnull. Pour plus d'informations sur les données de fréquence de répétition, consultezRépéter les données de fréquence.