Exemples d'utilisation de paramètres dansadditionalParamspour régler la configuration de l'entraînement au modèle - Amazon Neptune

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Exemples d'utilisation de paramètres dansadditionalParamspour régler la configuration de l'entraînement au modèle

Table des matières

Exemples de graphes de propriétés utilisantadditionalParams

Spécification d'un taux de fractionnement par défaut pour la configuration de l'entraînement au modèle

Dans l'exemple suivant, lesplit_ratedéfinit le taux de fractionnement par défaut pour l'entraînement au modèle. Si aucun taux de fractionnement par défaut n'est spécifié, la formation utilise une valeur de [0,9, 0,1, 0,0]. Vous remplacer la valeur par défaut par cible en spécifiant unsplit_ratepour chaque cible.

Dans l'exemple suivant, ledefault split_rateindique qu'un taux de fractionnement de[0.7,0.1,0.2]doivent être utilisés à moins d'être remplacés par cible : »

"additionalParams": { "neptune_ml": { "version": "v2.0", "split_rate": [0.7,0.1,0.2], "targets": [ (...) ], "features": [ (...) ] } }

Spécification d'une tâche de classification des nœuds pour la configuration de la formation aux modèles

Pour indiquer quelle propriété noeud contient des exemples étiquetés à des fins de formation, ajoutez un élément de classification de noeud à latargetstableau, utilisant"type" : "classification". Ajout d'unsplit_ratesi vous souhaitez remplacer le taux de fractionnement par défaut.

Dans l'exemple suivant, lenodecible indique que legenrepropriété de chaqueMovienoeud doit être traité comme une étiquette de classe de nœuds. Lesplit_ratevaleur remplace le taux de fractionnement par défaut :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "node": "Movie", "property": "genre", "type": "classification", "split_rate": [0.7,0.1,0.2] } ], "features": [ (...) ] } }

Spécification d'une tâche de classification de nœuds multi-classes pour la configuration de la formation aux modèles

Pour indiquer quelle propriété de nœud contient plusieurs exemples étiquetés à des fins de formation, ajoutez un élément de classification de noeuds au tableau cibles, en utilisant"type" : "classification", etseparatorpour spécifier un caractère pouvant être utilisé pour diviser une valeur de propriété cible en plusieurs valeurs de catégorie. Ajout d'unsplit_ratesi vous souhaitez remplacer le taux de fractionnement par défaut.

Dans l'exemple suivant, lenodecible indique que legenrepropriété de chaqueMovienoeud doit être traité comme une étiquette de classe de nœuds. Leseparatorindique que chaque propriété de genre contient plusieurs valeurs séparées par des points-virgules :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "node": "Movie", "property": "genre", "type": "classification", "separator": ";" } ], "features": [ (...) ] } }

Spécification d'une tâche de régression de nœud pour la configuration de l'entraînement au modèle

Pour indiquer quelle propriété de nœud contient des régressions étiquetées à des fins d'entraînement, ajoutez un élément de régression de noeud au tableau de cibles, en utilisant"type" : "regression". Ajoutez un champ split_rate si vous souhaitez remplacer le taux de fractionnement par défaut.

Procédez comme suit :nodecible indique que leratingpropriété de chaqueMovienoeud doit être traité comme une étiquette de régression de noeud :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "node": "Movie", "property": "rating", "type" : "regression", "split_rate": [0.7,0.1,0.2] } ], "features": [ ... ] } }

Spécification d'une tâche de classification des bords pour la configuration de la formation aux modèles

Pour indiquer quelle propriété Edge contient des exemples étiquetés à des fins d'entraînement, ajoutez un élément Edge à latargetstableau, utilisant"type" : "regression". Ajoutez un champ split_rate si vous souhaitez remplacer le taux de fractionnement par défaut.

Procédez comme suit :edgecible indique que lemetAtLocationpropriété de chaqueknowsedge doit être traité comme une étiquette de classe d'arête :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "edge": ["Person", "knows", "Person"], "property": "metAtLocation", "type": "classification" } ], "features": [ (...) ] } }

Spécification d'une tâche de classification Edge multi-classes pour la configuration de la formation au modèle

Pour indiquer quelle propriété Edge contient plusieurs exemples étiquetés à des fins d'entraînement, ajoutez un élément Edge à latargetstableau, utilisant"type" : "classification", et unseparatorpour spécifier un caractère utilisé pour diviser une valeur de propriété cible en plusieurs valeurs de catégorie. Ajout d'unsplit_ratesi vous souhaitez remplacer le taux de fractionnement par défaut.

Procédez comme suit :edgecible indique que lesentimentpropriété de chaquerepliedToedge doit être traité comme une étiquette de classe d'arête. Le champ séparateur indique que chaque propriété de sentiment contient plusieurs valeurs séparées par des virgules :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "edge": ["Person", "repliedTo", "Message"], "property": "sentiment", "type": "classification", "separator": "," } ], "features": [ (...) ] } }

Spécification d'une régression Edge pour la configuration de l'entraînement au modèle

Pour indiquer quelle propriété Edge contient des exemples de régression étiquetés à des fins d'entraînement, ajoutez unedgeà l'élémenttargetstableau, utilisant"type" : "regression". Ajout d'unsplit_ratesi vous souhaitez remplacer le taux de fractionnement par défaut.

Procédez comme suit :edgecible indique que leratingpropriété de chaquereviewedle bord doit être traité comme une régression d'arête :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "edge": ["Person", "reviewed", "Movie"], "property": "rating", "type" : "regression" } ], "features": [ (...) ] } }

Pour indiquer quels tronçons doivent être utilisés à des fins de formation de prédiction de liaison, ajoutez un élément Edge au tableau de cibles à l'aide de"type" : "link_prediction". Ajout d'unsplit_ratesi vous souhaitez remplacer le taux de fractionnement par défaut.

Procédez comme suit :edgecible indique quecitesles arêtes doivent être utilisées pour la prédiction des liens :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "edge": ["Article", "cites", "Article"], "type" : "link_prediction" } ], "features": [ (...) ] } }

Spécification d'une fonction de compartiment numérique

Vous pouvez spécifier une fonction de données numériques pour une propriété de nœud en ajoutant"type": "bucket_numerical"vers lefeaturestableau.

Procédez comme suit :nodeindique que la fonctionagepropriété de chaquePersonnoeud doit être traité comme une fonction de compartiment numérique :

"additionalParams": { "neptune_ml": { "targets": [ ... ], "features": [ { "node": "Person", "property": "age", "type": "bucket_numerical", "range": [1, 100], "bucket_cnt": 5, "slide_window_size": 3, "imputer": "median" } ] } }

Spécification d'unWord2Vecfonctionnalité

Vous pouvez spécifier unWord2Vecfonction pour une propriété de nœud en ajoutant"type": "text_word2vec"vers lefeaturestableau.

Procédez comme suit :nodeindique que la fonctiondescriptionpropriété de chaqueMoviedoit être traité comme un nœudWord2Vecfonction :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "Movie", "property": "description", "type": "text_word2vec", "language": "en_core_web_lg" } ] } }

Spécification d'unFastTextfonctionnalité

Vous pouvez spécifier unFastTextfonction pour une propriété de nœud en ajoutant"type": "text_fasttext"vers lefeaturestableau. Lelanguageest obligatoire et doit spécifier l'un des codes de langues suivants :

  • en(Anglais)

  • zh(Chinois)

  • hi(hindi)

  • es(Espagnol)

  • fr(Français)

Notez que letext_fasttextl'encodage ne peut pas gérer plus d'une langue à la fois dans une entité.

Procédez comme suit :nodeindique que le françaisdescriptionpropriété de chaqueMoviedoit être traité comme un nœudFastTextfonction :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "Movie", "property": "description", "type": "text_fasttext", "language": "fr", "max_length": 1024 } ] } }

Spécification d'unSentence BERTfonctionnalité

Vous pouvez spécifier unSentence BERTfonction pour une propriété de nœud en ajoutant"type": "text_sbert"vers lefeaturestableau. Il n'est pas nécessaire de spécifier la langue, car la méthode code automatiquement les entités de texte à l'aide d'un modèle linguistique multilingue.

Procédez comme suit :nodeindique que la fonctiondescriptionpropriété de chaqueMoviedoit être traité comme un nœudSentence BERTfonction :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "Movie", "property": "description", "type": "text_sbert128", } ] } }

Spécification d'unTF-IDFfonctionnalité

Vous pouvez spécifier unTF-IDFfonction pour une propriété de nœud en ajoutant"type": "text_tfidf"vers lefeaturestableau.

Procédez comme suit :nodeindique que la fonctionbiopropriété de chaquePersondoit être traité comme un nœudTF-IDFfonction :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "Movie", "property": "bio", "type": "text_tfidf", "ngram_range": [1, 2], "min_df": 5, "max_features": 1000 } ] } }

Spécification d'undatetimefonctionnalité

Le processus d'exportation déduit automatiquementdatetimefonctions pour les propriétés de date. Toutefois, si vous souhaitez limiter ladatetime_partsutilisé pour undatetimeou remplacez une spécification d'entité de manière à ce qu'une propriété normalement traitée comme uneautoest explicitement traitée comme undatetime, vous pouvez le faire en ajoutant un"type": "datetime"vers le tableau de fonctionnalités.

Procédez comme suit :nodeindique que la fonctioncreatedAtpropriété de chaquePostdoit être traité comme un nœuddatetimefonction :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "Post", "property": "createdAt", "type": "datetime", "datetime_parts": ["month", "weekday", "hour"] } ] } }

Spécification d'uncategoryfonctionnalité

Le processus d'exportation déduit automatiquementautofonctions pour les propriétés de chaînes et les propriétés numériques contenant plusieurs valeurs. Pour les propriétés numériques contenant des valeurs uniques, il déduitnumericalFonctions. Pour les propriétés de date, il déduitdatetimeFonctions.

Si vous souhaitez remplacer une spécification d'entité de manière à ce qu'une propriété soit traitée comme une fonction catégorielle, ajoutez un"type": "category"vers le tableau de fonctionnalités. Si la propriété contient plusieurs valeurs, incluez unseparator. Par exemple :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "Post", "property": "tag", "type": "category", "separator": "|" } ] } }

Spécification d'unnumericalfonctionnalité

Le processus d'exportation déduit automatiquementautofonctions pour les propriétés de chaînes et les propriétés numériques contenant plusieurs valeurs. Pour les propriétés numériques contenant des valeurs uniques, il déduitnumericalFonctions. Pour les propriétés de date, il déduitdatetimeFonctions.

Si vous souhaitez remplacer une spécification d'entité pour qu'une propriété soit traitée comme une propriéténumericalfonctionnalité, ajouter"type": "numerical"vers le tableau de fonctionnalités. Si la propriété contient plusieurs valeurs, incluez unseparator. Par exemple :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "Recording", "property": "duration", "type": "numerical", "separator": "," } ] } }

Spécification d'unautofonctionnalité

Le processus d'exportation déduit automatiquementautofonctions pour les propriétés de chaînes et les propriétés numériques contenant plusieurs valeurs. Pour les propriétés numériques contenant des valeurs uniques, il déduitnumericalFonctions. Pour les propriétés de date, il déduitdatetimeFonctions.

Si vous souhaitez remplacer une spécification d'entité pour qu'une propriété soit traitée comme une propriétéautofonctionnalité, ajouter"type": "auto"vers le tableau de fonctionnalités. Si la propriété contient plusieurs valeurs, incluez unseparator. Par exemple :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ ... ], "features": [ { "node": "User", "property": "role", "type": "auto", "separator": "," } ] } }

Exemples RDF utilisantadditionalParams

Spécification d'un taux de partage par défaut pour la configuration de l'entraînement au modèle

Dans l'exemple suivant, lesplit_ratedéfinit le taux de fractionnement par défaut pour l'entraînement au modèle. Si aucun taux de fractionnement par défaut n'est spécifié, la formation utilise une valeur de [0,9, 0,1, 0,0]. Vous remplacer la valeur par défaut par cible en spécifiant unsplit_ratepour chaque cible.

Dans l'exemple suivant, ledefault split_rateindique qu'un taux de fractionnement de[0.7,0.1,0.2]doivent être utilisés à moins d'être remplacés par cible : »

"additionalParams": { "neptune_ml": { "version": "v2.0", "split_rate": [0.7,0.1,0.2], "targets": [ (...) ] } }

Spécification d'une tâche de classification des nœuds pour la configuration de la formation aux modèles

Pour indiquer quelle propriété noeud contient des exemples étiquetés à des fins de formation, ajoutez un élément de classification de noeud à latargetstableau, utilisant"type" : "classification". Ajoutez un champ de nœud pour indiquer le type de nœud des nœuds cibles. Ajout d'unpredicatepour définir quelles données littérales sont utilisées comme entité de nœud cible du nœud cible. Ajout d'unsplit_ratesi vous souhaitez remplacer le taux de fractionnement par défaut.

Dans l'exemple suivant, lenodecible indique que legenrepropriété de chaqueMovienoeud doit être traité comme une étiquette de classe de nœuds. Lesplit_ratevaleur remplace le taux de fractionnement par défaut :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "node": "http://aws.amazon.com/neptune/csv2rdf/class/Movie", "predicate": "http://aws.amazon.com/neptune/csv2rdf/datatypeProperty/genre", "type": "classification", "split_rate": [0.7,0.1,0.2] } ] } }

Spécification d'une tâche de régression de nœud pour la configuration de l'entraînement au modèle

Pour indiquer quelle propriété de nœud contient des régressions étiquetées à des fins d'entraînement, ajoutez un élément de régression de noeud au tableau de cibles, en utilisant"type" : "regression". Ajout d'unnodepour indiquer le type de nœud des nœuds cibles. Ajout d'unpredicatepour définir quelles données littérales sont utilisées comme entité de nœud cible du nœud cible. Ajout d'unsplit_ratesi vous souhaitez remplacer le taux de fractionnement par défaut.

Procédez comme suit :nodecible indique que leratingpropriété de chaqueMovienoeud doit être traité comme une étiquette de régression de noeud :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "node": "http://aws.amazon.com/neptune/csv2rdf/class/Movie", "predicate": "http://aws.amazon.com/neptune/csv2rdf/datatypeProperty/rating", "type": "regression", "split_rate": [0.7,0.1,0.2] } ] } }

Pour indiquer quels tronçons doivent être utilisés à des fins de formation de prédiction de liaison, ajoutez un élément Edge au tableau de cibles à l'aide de"type" : "link_prediction". Additionsubject,predicateetobjectchamps pour spécifier le type d'arête. Ajout d'unsplit_ratesi vous souhaitez remplacer le taux de fractionnement par défaut.

Procédez comme suit :edgecible indique quedirectedarêtes qui se connectentDirectorspourMoviesdoit être utilisé pour la prédiction des liens :

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "subject": "http://aws.amazon.com/neptune/csv2rdf/class/Director", "predicate": "http://aws.amazon.com/neptune/csv2rdf/datatypeProperty/directed", "object": "http://aws.amazon.com/neptune/csv2rdf/class/Movie", "type" : "link_prediction" } ] } }

Pour indiquer que tous les tronçons doivent être utilisés à des fins de formation sur la prédiction des liens, ajoutez unedgedans le tableau cibles en utilisant"type" : "link_prediction". Ne pas ajoutersubject,predicate, ouobject. Ajout d'unsplit_ratesi vous souhaitez remplacer le taux de fractionnement par défaut.

"additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "type" : "link_prediction" } ] } }