Amazon Neptune ML pour l'apprentissage automatique sur des graphes - Amazon Neptune

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Amazon Neptune ML pour l'apprentissage automatique sur des graphes

Les grands ensembles de données connectés contiennent souvent des informations précieuses qui peuvent être difficiles à extraire à l'aide de requêtes basées uniquement sur l'intuition humaine. Les techniques d'apprentissage automatique (ML) peuvent aider à trouver des corrélations cachées dans des graphiques comportant des milliards de relations. Ces corrélations peuvent être utiles pour recommander des produits, prédire la solvabilité, identifier les fraudes et bien d'autres choses encore.

La fonctionnalité Neptune ML permet de créer et d'entraîner des modèles d'apprentissage automatique utiles sur de grands graphiques en quelques heures au lieu de plusieurs semaines. Pour ce faire, Neptune ML utilise la technologie GNN (Graph Neural Network) développée par Amazon SageMaker et la Deep Graph Library (DGL) (qui est open source). Les réseaux de neurones graphiques sont un domaine émergent de l'intelligence artificielle (voir, par exemple, Une enquête complète sur les réseaux de neurones graphiques). Pour un didacticiel pratique sur l'utilisation des GNN avec DGL, voir Apprentissage des réseaux de neurones graphes avec Deep Graph Library.

Note

Les sommets des graphes sont identifiés dans les modèles Neptune ML en tant que « nœuds ». Par exemple, la classification des sommets utilise un modèle d'apprentissage automatique de classification des nœuds, tandis que la régression des sommets utilise un modèle de régression des nœuds.

Ce que Neptune ML peut faire

Neptune prend en charge à la fois l'inférence transductive, qui renvoie des prédictions précalculées au moment de l'entraînement, sur la base des données graphiques de ce moment-là, et l'inférence inductive, qui renvoie le traitement des données et l'évaluation du modèle en temps réel, sur la base des données actuelles. Consultez La différence entre l'inférence inductive et l'inférence transductive.

Neptune ML peut entraîner des modèles d'apprentissage automatique pour prendre en charge cinq catégories d'inférence différentes :

Types de tâches d'inférence actuellement pris en charge par Neptune ML
  • Classification des nœuds : prédiction de la caractéristique catégorielle d'une propriété de sommet.

    Par exemple, étant donné le film The Shawshank Redemption, Neptune ML peut prédire sagenre propriétéstory à partir d'un ensemble candidat de[story, crime, action, fantasy, drama, family, ...].

    Il existe deux types de tâches de classification de nœuds de classification de nœuds de classification de nœuds de classification de

    • Classification à classe unique : dans ce type de tâche, chaque nœud ne possède qu'une seule fonctionnalité cible. Par exemple, la propriétéPlace_of_birth ofAlan Turing a la valeurUK.

    • Classification multiclasse : dans ce type de tâche, chaque nœud peut avoir plusieurs entités cibles. Par exemple, la propriétégenre du film Le Parrain a les valeurscrime etstory.

  • Régression de nœud : prédiction d'une propriété numérique d'un sommet.

    Par exemple, étant donné le film Avengers : Endgame, Neptune ML peut prédire que sa propriétépopularity a une valeur de5.0.

  • Classification des arêtes : prédiction de la caractéristique catégorielle d'une propriété d'arête.

    Il existe deux types de tâches de classification de pointe de classification de la plus simple :

    • Classification à classe unique : dans ce type de tâche, chaque arête ne possède qu'une seule entité cible. Par exemple, un écart de classement entre un utilisateur et un film peut avoir la propriétéliked, avec une valeur « Oui » ou « Non ».

    • Classification multiclasse : dans ce type de tâche, chaque arête peut avoir plusieurs entités cibles. Par exemple, une évaluation entre un utilisateur et un film peut comporter plusieurs valeurs pour la balise de propriété, telles que « Funny », « Heartwarming », « Chilling », etc.

  • Régression d'arête : prédiction d'une propriété numérique d'une arête.

    Par exemple, un avantage de classement entre un utilisateur et un film peut avoir la propriété numériquescore, pour laquelle Neptune ML pourrait prédire une valeur attribuée à un utilisateur et à un film.

  • Prédiction des liens : prédiction des nœuds de destination les plus probables pour un nœud source et un périphérique sortant particuliers, ou des nœuds sources les plus probables pour un nœud de destination et un périmètre entrant donnés.

    Par exemple, avec un graphe de connaissances sur les médicaments et les maladies, indiqué enAspirin tant que nœud source ettreats en tant que périphérie sortante, Neptune ML peut prédire les nœuds de destination les plus pertinents sous la formeheart diseasefever, et ainsi de suite.

    Ou, avec le graphe de connaissances de Wikimedia, indiquéPresident-of comme arête ou relation etUnited-States comme nœud de destination, Neptune ML peut prédire les têtes les plus pertinentes sous la formeGeorge WashingtonAbraham Lincoln,Franklin D. Roosevelt, et ainsi de suite.

Note

La classification des nœuds et la classification des bords ne prennent en charge que les valeurs de chaîne. Cela signifie que les valeurs de propriété numériques telles que0 ou ne1 sont pas prises en charge, bien que les chaînes soient équivalentes à"0" et le"1" soient. De même, les valeurs de la propriété booléennetrue etfalse ne fonctionnent pas, mais"true" et"false" fonctionnent.

Avec Neptune ML, vous pouvez utiliser des modèles d'apprentissage automatique qui se répartissent en deux catégories générales :

Types de modèles d'apprentissage automatique actuellement pris en charge par Neptune ML
  • Modèles de réseaux neuronaux graphiques (GNN) : ils incluent les réseaux convolutifs de graphes relationnels (r-GCN). Les modèles GNN fonctionnent pour les trois types de tâches ci-dessus.

  • Modèles Knowledge Graph Embedding (KGE) : ceux-ci incluent lesRotatE modèlesTransEDistMult, et. Ils ne fonctionnent que pour la prédiction des liens.

Modèles définis par l'utilisateur : Neptune ML vous permet également de fournir votre propre implémentation de modèle personnalisé pour tous les types de tâches répertoriés ci-dessus. Vous pouvez utiliser la boîte à outils Neptune ML pour développer et tester l'implémentation de votre modèle personnalisé basé sur Python avant d'utiliser l'API de formation Neptune ML avec votre modèle. DécouvrezModèles personnalisés dans Neptune ML comment structurer et organiser votre implémentation afin qu'elle soit compatible avec l'infrastructure de formation de Neptune ML.