Ensemble de données d'interactions entre objets - Amazon Personalize

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Ensemble de données d'interactions entre objets

Une interaction avec un article est un événement d'interaction positive entre un utilisateur et un article de votre catalogue. Par exemple, un utilisateur qui regarde un film, consulte une annonce ou achète une paire de chaussures. Vous importez des données relatives aux interactions de vos utilisateurs avec vos articles dans un jeu de données sur les interactions entre articles. Vous pouvez enregistrer plusieurs types d'événements, tels que les clics, les visionnages ou les likes.

Par exemple, si un utilisateur clique sur un article en particulier puis l'aime, vous pouvez demander à Amazon Personalize d'utiliser ces événements comme données de formation. Pour chaque événement, vous devez enregistrer l'identifiant de l'utilisateur, l'identifiant de l'élément, l'horodatage (au format Unix Time Epoch) et le type d'événement (click and like). Vous ajouteriez ensuite les deux événements d'interaction entre éléments à un jeu de données d'interactions entre articles.

Pour tous les cas d'utilisation (groupes de jeux de données de domaine) et toutes les recettes (ressources personnalisées), les données relatives aux interactions entre les éléments doivent présenter les caractéristiques suivantes :

  • Au moins 1 000 enregistrements d'interactions entre articles provenant d'utilisateurs interagissant avec des articles de votre catalogue. Ces interactions peuvent provenir d'importations groupées, d'événements diffusés en continu, ou des deux.

  • Au moins 25 identifiants d'utilisateur uniques avec au moins deux interactions avec des éléments pour chacun.

Pour des recommandations de qualité, nous vous recommandons d'avoir au moins 50 000 interactions entre articles provenant d'au moins 1 000 utilisateurs, avec au moins deux interactions avec des articles chacun.

Pour créer une recommandation ou une solution personnalisée, vous devez au minimum créer un jeu de données sur les interactions entre les articles. Cette section fournit des informations sur les types de données d'interactions entre articles suivants que vous pouvez importer dans Amazon Personalize.

Données relatives au type et à la valeur de l'événement

Un jeu de données d'interactions entre articles peut stocker des données sur le type d'événement et la valeur de l'événement pour chaque interaction. Seules les ressources personnalisées utilisent les données relatives aux valeurs des événements.

Données relatives au type d'événement

Amazon Personalize utilise les données relatives aux types d'événements, telles que les données relatives aux clics ou aux achats, pour identifier les intentions et les intérêts des utilisateurs. Si vous créez des recommandations de domaines, tous les cas d'utilisation nécessitent des données de type d'événement. Certains cas d'utilisation nécessitent des types d'événements spécifiques. Vous êtes libre d'utiliser d'autres types d'événements. Pour plus d’informations, consultez Choix d'un cas d'utilisation.

Si vous créez des ressources personnalisées, vous pouvez choisir les événements utilisés pour la formation par type d'événement. Si votre ensemble de données contient plusieurs types d'événements dans une colonne EVENT_TYPE, et que vous ne fournissez aucun type d'événement lorsque vous configurez une solution personnalisée, Amazon Personalize utilise toutes les données d'interactions entre articles pour l'entraînement avec le même poids, quel que soit le type. Pour plus d’informations, consultez Choix des données d'interaction entre les objets utilisées pour l'entraînement.

Types d'événements positifs et négatifs

Amazon Personalize part du principe que toute interaction est positive. Les interactions avec un type d'événement négatif, tel que l'aversion, n'empêcheront pas nécessairement l'élément d'apparaître dans les futures recommandations de l'utilisateur.

Voici comment les événements négatifs et le désintérêt des utilisateurs peuvent influencer les recommandations :

Données relatives à la valeur des événements (ressources personnalisées)

Les données relatives à la valeur de l'événement peuvent être le pourcentage d'un film regardé par un utilisateur ou une note sur 10. Si vous créez des solutions personnalisées et importez des données de valeur d'événement ainsi que des données de type d'événement, vous pouvez choisir les enregistrements utilisés pour l'entraînement en fonction du type et de la valeur. Avec les recommandations de domaines, Amazon Personalize n'utilise pas les données relatives à la valeur des événements et vous ne pouvez pas filtrer les événements avant l'entraînement.

Pour choisir des enregistrements en fonction du type et de la valeur, enregistrez un type d'événement et une valeur d'événement pour chaque événement. La valeur que vous choisissez pour chaque événement dépend des données que vous souhaitez exclure et des types d'événements que vous enregistrez. Par exemple, vous pouvez faire correspondre l'activité de l'utilisateur, par exemple le pourcentage de vidéos regardées par l'utilisateur pour les types d'événements à regarder.

Lorsque vous configurez une solution, vous définissez une valeur spécifique comme seuil pour exclure les enregistrements de la formation. Par exemple, si vos données EVENT_VALUE pour les événements suivis d'un EVENT_TYPE correspondent au pourcentage d'une vidéo regardée par un utilisateur, si vous définissez le seuil de valeur de l'événement à 0,5 et le type d'événement à regarder, Amazon Personalize entraîne le modèle en utilisant uniquement les événements d'interaction avec le watch dont la valeur EVENT_VALUE est supérieure ou égale à 0,5.

Pour plus d’informations, consultez Choix des données d'interaction entre les objets utilisées pour l'entraînement.

Métadonnées contextuelles

Avec certaines recettes et certains cas d'utilisation de recommandations, Amazon Personalize peut utiliser des métadonnées contextuelles pour identifier les modèles sous-jacents qui révèlent les éléments les plus pertinents pour vos utilisateurs. Les métadonnées contextuelles sont des données d'interactions que vous collectez sur l'environnement de l'utilisateur au moment d'un événement, telles que sa localisation ou son type d'appareil.

L'inclusion de métadonnées contextuelles vous permet de proposer une expérience plus personnalisée aux utilisateurs existants. Par exemple, si les clients font leurs achats différemment lorsqu'ils accèdent à votre catalogue depuis un téléphone par rapport à un ordinateur, incluez des métadonnées contextuelles relatives à l'appareil de l'utilisateur. Les recommandations seront alors plus pertinentes en fonction de leur mode de navigation.

De plus, les métadonnées contextuelles permettent de réduire la phase de démarrage à froid pour les nouveaux utilisateurs ou les utilisateurs non identifiés. La phase de démarrage à froid fait référence à la période pendant laquelle votre moteur de recommandation fournit des recommandations moins pertinentes en raison du manque d'informations historiques concernant cet utilisateur.

Pour les groupes de jeux de données de domaine, les cas d'utilisation des recommandations suivants peuvent utiliser des métadonnées contextuelles :

Pour les ressources personnalisées, les recettes qui utilisent des métadonnées contextuelles sont les suivantes :

Pour plus d'informations sur les informations contextuelles, consultez le billet de blog sur le AWS Machine Learning suivant : Augmenter la pertinence de vos recommandations Amazon Personalize en tirant parti des informations contextuelles.

Données sur les impressions

Les impressions sont des listes d'éléments visibles par un utilisateur lorsqu'il interagissait avec un élément en particulier (par exemple, en cliquant ou en regardant). Si vous utilisez un cas d'utilisation de domaine qui fournit la personnalisation ou la Personnalisation par l'utilisateur recette, Amazon Personalize peut utiliser les données d'impressions pour guider l'exploration.

Dans le cadre de l'exploration, les recommandations incluent certains éléments ou actions qui sont généralement moins susceptibles d'être recommandés à l'utilisateur, tels que de nouveaux éléments ou actions, des éléments ou des actions avec peu d'interactions, ou des éléments ou actions moins pertinents pour l'utilisateur en raison de son comportement antérieur. Plus un article apparaît fréquemment dans les données d'impressions, moins il est probable qu'Amazon Personalize l'inclut dans l'exploration.

Lorsque vous créez un recommandeur ou une solution, Amazon Personalize exclut toujours les données relatives aux impressions de la formation. Cela est dû au fait qu'Amazon Personalize n'entraîne pas vos modèles à l'aide des données d'impressions. Il l'utilise plutôt lorsque vous recevez des recommandations pour guider l'exploration de l'utilisateur.

Les valeurs d'impression peuvent comporter au maximum 1 000 caractères (y compris la barre verticale). Pour les groupes de jeux de données de domaine, les cas d'utilisation des recommandations suivants peuvent utiliser des données d'impressions :

Pour plus d'informations sur l'exploration, voirExploration. Amazon Personalize peut modéliser deux types d'impressions : Impressions implicites etImpressions explicites.

Impressions implicites

Les impressions implicites sont les recommandations, extraites d'Amazon Personalize, que vous montrez à l'utilisateur. Vous pouvez les intégrer dans votre flux de travail de recommandation en incluant les RecommendationId (renvoyés par les GetPersonalizedRanking opérations GetRecommendations et) en tant qu'entrée pour les PutEvents demandes futures. Amazon Personalize calcule les impressions implicites en fonction de vos données de recommandation.

Par exemple, il se peut que vous disposiez d'une application qui fournit des recommandations pour le streaming vidéo. Votre flux de travail de recommandation utilisant des impressions implicites peut être le suivant :

  1. Vous demandez des recommandations vidéo à l'un de vos utilisateurs à l'aide de l'opération Amazon Personalize GetRecommendations API.

  2. Amazon Personalize génère des recommandations pour l'utilisateur utilisant votre modèle (version de la solution) et les renvoie avec un recommendationId dans la réponse de l'API.

  3. Vous montrez les recommandations vidéo à votre utilisateur dans votre application.

  4. Lorsque votre utilisateur interagit avec une vidéo (par exemple, clique), enregistrez le choix dans un appel à l'PutEventsAPI et incluez-le en recommendationId tant que paramètre. Pour un exemple de code, voirEnregistrement des données d'impressions.

  5. Amazon Personalize utilise les données d'impression recommendationId à partir des recommandations vidéo précédentes, puis utilise les données d'impression pour guider l'exploration, les recommandations futures incluant de nouvelles vidéos avec moins de données d'interactions ou de pertinence.

    Pour plus d'informations sur l'enregistrement d'événements avec des données d'impression implicites, consultezEnregistrement des données d'impressions.

Impressions explicites

Les impressions explicites sont des impressions que vous enregistrez et envoyez manuellement à Amazon Personalize. Utilisez des impressions explicites pour manipuler les résultats d'Amazon Personalize. L'ordre des articles n'a aucun impact.

Par exemple, vous pouvez avoir une application d'achat qui fournit des recommandations pour les chaussures. Si vous ne recommandez que des chaussures actuellement en stock, vous pouvez spécifier ces articles en utilisant des impressions explicites. Votre flux de travail de recommandation utilisant des impressions explicites peut être le suivant :

  1. Vous demandez des recommandations pour l'un de vos utilisateurs à l'aide de l'GetRecommendationsAPI Amazon Personalize.

  2. Amazon Personalize génère des recommandations pour l'utilisateur utilisant votre modèle (version de la solution) et les renvoie dans la réponse de l'API.

  3. Vous ne montrez à l'utilisateur que les chaussures recommandées en stock.

  4. Pour l'importation de données incrémentielle en temps réel, lorsque votre utilisateur interagit avec (par exemple, clique) avec une paire de chaussures, vous enregistrez son choix lors d'un appel à l'PutEventsAPI et vous listez les articles recommandés qui sont en stock dans le impression paramètre. Pour un exemple de code, voirEnregistrement des données d'impressions.

    Pour importer des impressions dans les données historiques des interactions entre articles, vous pouvez répertorier les impressions explicites dans votre fichier csv et séparer chaque élément par un caractère « | ». Les caractères de la barre verticale sont pris en compte dans la limite de 1 000 caractères. Pour obtenir un exemple, consultez Formatage d'impressions explicites.

  5. Amazon Personalize utilise les données d'impression pour guider l'exploration, et les recommandations futures incluent de nouvelles chaussures avec moins de données d'interactions ou de pertinence.