Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Amazon Neptune ML pour l'apprentissage automatique sur des graphes
Les grands ensembles de données connectés contiennent souvent des informations précieuses qui peuvent être difficiles à extraire à l'aide de requêtes basées uniquement sur l'intuition humaine. Les techniques d'apprentissage automatique (ML) peuvent aider à trouver des corrélations cachées dans des graphiques comportant des milliards de relations. Ces corrélations peuvent être utiles pour recommander des produits, prédire la solvabilité, identifier les fraudes et bien d'autres choses encore.
La fonctionnalité Neptune ML permet de créer et d'entraîner des modèles d'apprentissage automatique utiles sur de grands graphiques en quelques heures au lieu de plusieurs semaines. Pour ce faire, Neptune ML utilise la technologie GNN (Graph Neural Network) développée par Amazon SageMaker
Note
Les sommets des graphes sont identifiés dans les modèles Neptune ML en tant que « nœuds ». Par exemple, la classification des sommets utilise un modèle d'apprentissage automatique de classification des nœuds, tandis que la régression des sommets utilise un modèle de régression des nœuds.
Ce que Neptune ML peut faire
Neptune prend en charge à la fois l'inférence transductive, qui renvoie des prédictions précalculées au moment de l'entraînement, sur la base des données graphiques de ce moment-là, et l'inférence inductive, qui renvoie le traitement des données et l'évaluation du modèle en temps réel, sur la base des données actuelles. Consultez La différence entre l'inférence inductive et l'inférence transductive.
Neptune ML peut entraîner des modèles d'apprentissage automatique pour prendre en charge cinq catégories d'inférence différentes :
Types de tâches d'inférence actuellement pris en charge par Neptune ML
-
Classification des nœuds : prédiction de la caractéristique catégorielle d'une propriété de sommet.
Par exemple, étant donné le film The Shawshank Redemption, Neptune ML peut prédire sa
genre
propriétéstory
à partir d'un ensemble candidat de[story, crime, action, fantasy, drama, family, ...]
.Il existe deux types de tâches de classification de nœuds de classification de nœuds de classification de nœuds de classification de
Classification à classe unique : dans ce type de tâche, chaque nœud ne possède qu'une seule fonctionnalité cible. Par exemple, la propriété
Place_of_birth
ofAlan Turing
a la valeurUK
.Classification multiclasse : dans ce type de tâche, chaque nœud peut avoir plusieurs entités cibles. Par exemple, la propriété
genre
du film Le Parrain a les valeurscrime
etstory
.
-
Régression de nœud : prédiction d'une propriété numérique d'un sommet.
Par exemple, étant donné le film Avengers : Endgame, Neptune ML peut prédire que sa propriété
popularity
a une valeur de5.0
. -
Classification des arêtes : prédiction de la caractéristique catégorielle d'une propriété d'arête.
Il existe deux types de tâches de classification de pointe de classification de la plus simple :
Classification à classe unique : dans ce type de tâche, chaque arête ne possède qu'une seule entité cible. Par exemple, un écart de classement entre un utilisateur et un film peut avoir la propriété
liked
, avec une valeur « Oui » ou « Non ».Classification multiclasse : dans ce type de tâche, chaque arête peut avoir plusieurs entités cibles. Par exemple, une évaluation entre un utilisateur et un film peut comporter plusieurs valeurs pour la balise de propriété, telles que « Funny », « Heartwarming », « Chilling », etc.
-
Régression d'arête : prédiction d'une propriété numérique d'une arête.
Par exemple, un avantage de classement entre un utilisateur et un film peut avoir la propriété numérique
score
, pour laquelle Neptune ML pourrait prédire une valeur attribuée à un utilisateur et à un film. -
Prédiction des liens : prédiction des nœuds de destination les plus probables pour un nœud source et un périphérique sortant particuliers, ou des nœuds sources les plus probables pour un nœud de destination et un périmètre entrant donnés.
Par exemple, avec un graphe de connaissances sur les médicaments et les maladies, indiqué en
Aspirin
tant que nœud source ettreats
en tant que périphérie sortante, Neptune ML peut prédire les nœuds de destination les plus pertinents sous la formeheart disease
fever
, et ainsi de suite.Ou, avec le graphe de connaissances de Wikimedia, indiqué
President-of
comme arête ou relation etUnited-States
comme nœud de destination, Neptune ML peut prédire les têtes les plus pertinentes sous la formeGeorge Washington
Abraham Lincoln
,Franklin D. Roosevelt
, et ainsi de suite.
Note
La classification des nœuds et la classification des bords ne prennent en charge que les valeurs de chaîne. Cela signifie que les valeurs de propriété numériques telles que0
ou ne1
sont pas prises en charge, bien que les chaînes soient équivalentes à"0"
et le"1"
soient. De même, les valeurs de la propriété booléennetrue
etfalse
ne fonctionnent pas, mais"true"
et"false"
fonctionnent.
Avec Neptune ML, vous pouvez utiliser des modèles d'apprentissage automatique qui se répartissent en deux catégories générales :
Types de modèles d'apprentissage automatique actuellement pris en charge par Neptune ML
Modèles de réseaux neuronaux graphiques (GNN) : ils incluent les réseaux convolutifs de graphes relationnels (r-GCN)
. Les modèles GNN fonctionnent pour les trois types de tâches ci-dessus. Modèles Knowledge Graph Embedding (KGE) : ceux-ci incluent les
RotatE
modèlesTransE
DistMult
, et. Ils ne fonctionnent que pour la prédiction des liens.
Modèles définis par l'utilisateur : Neptune ML vous permet également de fournir votre propre implémentation de modèle personnalisé pour tous les types de tâches répertoriés ci-dessus. Vous pouvez utiliser la boîte à outils Neptune ML