Amazon Neptune ML pour le machine learning sur les graphes

Les grands jeux de données connectés contiennent souvent des informations précieuses qu'il peut être difficile d'extraire sur la seule base de l'intuition humaine. Les techniques de machine learning (ML) peuvent aider à trouver des corrélations cachées dans des graphes contenant des milliards de relations. Ces corrélations peuvent être utiles pour recommander des produits, prédire la solvabilité, identifier des fraudes et bien d'autres choses encore.

La fonctionnalité Neptune ML permet de créer et d'entraîner des modèles de machine learning utiles sur de grands graphes en quelques heures au lieu de plusieurs semaines. Pour ce faire, Neptune ML utilise la technologie GNN (Graph Neural Network) développée par Amazon SageMaker AI et la Deep Graph Library (DGL) (qui est open source). Les réseaux de neurones en graphes sont un domaine émergent de l'intelligence artificielle (consultez, par exemple, A Comprehensive Survey on Graph Neural Networks). Pour un didacticiel pratique sur l'utilisation GNNs de DGL, voir Apprendre les réseaux neuronaux à graphes avec Deep Graph Library.

Note

Les sommets d'un graphe sont identifiés dans les modèles Neptune ML en tant que « nœuds ». Par exemple, la classification de sommet utilise un modèle de machine learning de classification de nœud, tandis que la régression de sommet utilise un modèle de régression de nœud.

Ce que Neptune ML peut faire

Neptune prend en charge à la fois l'inférence transductive, qui renvoie des prédictions précalculées au moment de l'entraînement, en fonction de vos données de graphe à ce moment-là, et l'inférence inductive, qui renvoie et applique le traitement des données et l'évaluation du modèle en temps réel, sur la base des données actuelles. Consultez Différence entre inférence inductive et inférence transductive.

Neptune ML peut entraîner des modèles de machine learning pour prendre en charge cinq catégories d'inférence différentes :

Types de tâche d'inférence actuellement pris en charge par Neptune ML

Classification de nœud : prédiction de la fonctionnalité catégorielle d'une propriété de sommet.

Par exemple, pour le film Les Évadés, Neptune ML peut prédire sa propriété genre en tant que story à partir d'un ensemble de candidats [story, crime, action, fantasy, drama, family, ...].

Il existe deux types de tâches de classification de nœud :
- Classification à classe unique : dans ce type de tâche, chaque nœud possède une seule fonctionnalité cible. Par exemple, la propriété Place_of_birth de Alan Turing a la valeur UK.
- Classification multiclasse : dans ce type de tâche, chaque nœud peut avoir plus d'une seule fonctionnalité cible. Par exemple, la propriété genre du film Le Parrain a les valeurs crime et story.
Régression de nœud : prédiction d'une propriété numérique d'un sommet.

Par exemple, pour le film Avengers, le dernier affrontement, Neptune ML peut prédire que sa propriété popularity a une valeur de 5.0.
Classification d'arête : prédiction de la fonctionnalité catégorielle d'une propriété d'arête.

Il existe deux types de tâches de classification d'arête :
- Classification à classe unique : dans ce type de tâche, chaque arête possède une seule fonctionnalité cible. Par exemple, une arête d'évaluation entre un utilisateur et un film peut avoir la propriété liked, avec la valeur « Oui » ou « Non ».
- Classification multiclasse : dans ce type de tâche, chaque arête peut avoir plus d'une seule fonctionnalité cible. Par exemple, une évaluation entre un utilisateur et un film peut avoir plusieurs valeurs de balise de propriété, telles que « Drôle », « Réconfortant », « Reposant », etc.
Régression d'arête : prédiction d'une propriété numérique d'une arête.

Par exemple, une arête d'évaluation entre un utilisateur et un film peut avoir la propriété numérique score, pour laquelle Neptune ML peut prédire une valeur à partir d'un utilisateur et d'un film.
Prédiction de lien : prédiction des nœuds de destination les plus probables pour un nœud source et une arête sortante particuliers, ou des nœuds sources les plus probables pour un nœud de destination et une arête entrante donnés.

Par exemple, avec un graphe de connaissances médicament-maladie, avec Aspirin comme nœud source et treats comme arête sortante, Neptune ML peut prédire les nœuds de destination les plus pertinents heart disease, fever, etc.

Ou, avec le graphe de connaissances de Wikimedia, avec President-of comme arête ou relation et United-States comme nœud de destination, Neptune ML peut prédire les têtes les plus pertinentes George Washington, Abraham Lincoln, Franklin D. Roosevelt, etc.

Note

La classification de nœud et la classification d'arête prennent en charge uniquement des valeurs de chaîne. Cela signifie que des valeurs de propriété numériques telles que 0 ou 1 ne sont pas prises en charge, alors que les valeurs équivalentes de type string "0" et "1" le sont. De même, les valeurs de propriété booléenne true et false ne fonctionnent pas, mais "true" et "false" fonctionnent.

Avec Neptune ML, vous pouvez utiliser des modèles de machine learning séparés en deux catégories générales :

Types de modèles de machine learning actuellement pris en charge par Neptune ML

Modèles de réseaux neuronaux à graphes (GNN) : ils incluent les réseaux convolutionnels à graphes relationnels (R -). GCNs Les modèles GNN fonctionnent pour les trois types de tâches ci-dessus.
Modèles d'intégration de graphe de connaissances (KGE) : ils incluent les modèles TransE, DistMult et RotatE. Ils fonctionnent uniquement pour la prédiction de lien.

Modèles définis par l'utilisateur : Neptune ML vous permet également de fournir votre propre implémentation de modèle personnalisé pour tous les types de tâches répertoriés ci-dessus. Vous pouvez utiliser la boîte à outils Neptune ML pour développer et tester votre implémentation de modèle personnalisé basée sur Python avant d'utiliser l'API d'entraînement Neptune ML avec votre modèle. Consultez Modèles personnalisés dans Neptune ML pour plus de détails sur la manière de structurer et d'organiser votre implémentation afin qu'elle soit compatible avec l'infrastructure d'entraînement de Neptune ML.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Exemples de fonctions Lambda

Configuration de Neptune ML