Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Création de JSON fichiers de schéma pour les schémas Amazon Personalize
Après avoir préparé vos données, vous êtes prêt à créer des JSON fichiers de schéma pour chaque type de données que vous importez. Ces fichiers décrivent la structure et le contenu de vos données, y compris les noms des colonnes et leurs types de données.
Vous utilisez des JSON fichiers de schéma lorsque vous créez un schéma Amazon Personalize dansCréation d'un schéma et d'un jeu de données. Dans Amazon Personalize, un schéma est une ressource qui permet à Amazon Personalize d'analyser les données lorsque vous les importez dans votre ensemble de données. Vous créez un schéma pour chaque jeu de données que vous utilisez.
Pour les ressources personnalisées, chaque ensemble de données a des exigences de schéma spécifiques. Pour les groupes de jeux de données de domaine, le domaine que vous choisissez détermine les exigences de votre jeu de données et de schéma. Chaque domaine possède un schéma par défaut pour chaque type de jeu de données. Lorsque vous créez un jeu de données, vous pouvez utiliser le schéma de domaine existant ou en créer un nouveau en modifiant le schéma par défaut existant. Utilisez le schéma par défaut comme guide pour déterminer les données à importer pour votre domaine.
Les sections suivantes présentent les exigences personnalisées et de domaine relatives à la création d'un JSON fichier de schéma pour chaque type de jeu de données.
Rubriques
Exigences relatives au formatage du schéma
Lorsque vous créez un schéma pour un ensemble de données dans un groupe de jeux de données de domaine ou un groupe de jeux de données personnalisé, vous devez suivre les directives suivantes :
-
Vous devez définir le schéma au format Avro.
Pour plus d'informations sur les types de données Avro que nous prenons en charge, consultezTypes de données de schéma. -
Un schéma possède une clé de nom dont la valeur doit correspondre au type de jeu de données.
-
Les champs du schéma peuvent apparaître dans n'importe quel ordre, mais ils doivent correspondre à l'ordre des en-têtes de colonne correspondants dans votre CSV fichier.
-
Les schémas doivent être des JSON fichiers plats sans structures imbriquées. Par exemple, un champ ne peut pas être le parent de plusieurs sous-champs.
-
Les schémas Amazon Personalize ne prennent pas en charge les types complexes tels que les tableaux et les cartes.
-
Les champs du schéma doivent avoir des noms alphanumériques uniques. Par exemple, vous ne pouvez pas ajouter à la fois un
GENRES_FIELD_1
champ et unGENRESFIELD1
champ. -
Vous devez définir les champs obligatoires en tant que types de données obligatoires. Les champs de chaîne catégorielle réservés doivent avoir l'
categorical
attribut défini surtrue
, tandis que les champs de chaîne réservés ne peuvent pas être catégoriques. Les mots clés ne peuvent pas figurer dans vos données. -
Si vous ajoutez votre propre champ de métadonnées
string
et que vous souhaitez qu'Amazon Personalize l'utilise lors de la formation, il doit inclure l'categorical
attribut ou l'textual
attribut (seuls les schémas d'articles prennent en charge les champs comportant l'attribut textuel). -
Amazon Personalize n'utilise pas
boolean
de données de type lors de la formation ou du filtrage des recommandations. Pour qu'Amazon Personalize utilise des données booléennes lors de l'entraînement ou du filtrage, utilisez un champ de type String et utilisez les valeurs"True"
et contenues"False"
dans vos données. Vous pouvez également utiliser le type int ou long et les valeurs0
et1
. -
Les champs textuels doivent être du type
string
et leurtextual
attribut doit être défini sur.true
Pour plus d'informations sur les données de texte non structurées, consultezMétadonnées de texte non structurées.
Les ensembles de données de groupes de jeux de données de domaine ont des exigences supplémentaires basées à la fois sur le domaine et le type de jeu de données. Les ensembles de données de groupes de jeux de données personnalisés ont des exigences supplémentaires en fonction du type.
Types de données de schéma
Les schémas Amazon Personalize prennent en charge les types Avro suivants pour les champs :
-
float
-
double
-
int
-
long
-
chaîne
-
un booléen
-
null
Certains champs obligatoires et réservés prennent en charge les données nulles. L'ajout d'un null
type à un champ vous permet d'utiliser des données imparfaites (par exemple, des métadonnées avec des valeurs vides) pour générer des recommandations. Pour plus d'informations sur les champs qui prennent en charge les données nulles, consultez la rubrique relative aux exigences du schéma pour votre domaine : VIDEODEMANDEnsembles de données et schémas _ON_ECOMMERCEensembles de données et schémas, ouEnsembles de données et schémas personnalisés. L'exemple suivant montre comment ajouter un type nul pour un GENDER champ.
{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }