Utilisation des blocs-notes Neptune pour démarrer rapidement - Amazon Neptune

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation des blocs-notes Neptune pour démarrer rapidement

Vous n'avez pas besoin d'utiliser les carnets de graphiques Neptune pour travailler avec un graphe Neptune, donc si vous le souhaitez, vous pouvez créer une nouvelle base de données Neptune immédiatement à l'aide d'unAWS CloudFormationmodèle.

En même temps, que vous soyez novice en matière de graphiques et que vous souhaitiez apprendre et expérimenter, ou que vous ayez de l'expérience et que vous souhaitiez affiner vos requêtes, les blocs-notes graphiques Neptune offrent une excellente plateforme de développement et peuvent vous faire gagner un temps considérable.

Neptune fournit un open sourceBlocs-notes Jupyterdans leBloc-notes Neptune Graphproject sur GitHub. Ces blocs-notes présentent des didacticiels et des exemples de code dans un environnement de codage interactif où vous pouvez en apprendre davantage sur la technologie des graphes et Neptune.

Tous les carnets du/src/graph_notebook/carnetsdossier du cahier graphique GitHub repository sont open source. Vous pouvez les utiliser pour configurer, remplir et interroger des graphiques à l'aide de différents langages de requête, de différents ensembles de données et même de différentes bases de données sur le back-end.

Vous pouvez héberger ces blocs-notes de plusieurs manières :

  • LeÉtabli Neptunevous permet d'exécuter des blocs-notes Jupyter dans un environnement entièrement géré, hébergé sur Amazon SageMaker, et se connecte automatiquement au NeptuneBloc-notes Graphun projet pour vous. Il est facile de configurer l'établi dans leConsole Neptunelorsque vous créez une base de données Neptune.

  • Vous pouvez égalementinstaller Jupyter localementet exécutez les blocs-notes depuis votre ordinateur portable, connecté soit à Neptune, soit à une instance locale de l'une des bases de données de graphes open source. Dans ce dernier cas, vous pouvez expérimenter la technologie graphique autant que vous le souhaitez avant de dépenser un centime, puis passer en douceur à l'environnement de production géré proposé par Neptune.

Utilisation de l'atelier Neptune pour héberger des blocs-notes Neptune

Un moyen simple de configurer les carnets Neptune Jupyter ainsi que tous les ordinateurs portables que vous créez vous-même consiste à utiliser l'atelier Neptune. L'atelier fournit un environnement entièrement géré pour les ordinateurs portables, hébergé par Amazon SageMaker, et crée automatiquement des liens vers les blocs-notes dans le logiciel open sourceBloc-notes GraphProject.

Offres NeptuneT3types d'instances avec lesquels vous pouvez démarrer pour seulement 0,10 $/heure (consultezla page de tarification de Neptune).

Amazon vous facture les ressources du workbench SageMaker, séparément de votre facturation Neptune.

Vous pouvez utiliser la console Neptune pour configurer l'atelier Neptune dans Amazon. SageMakerlorsque vous créez un nouveau cluster de base de données. Après cela, il est facile d'utiliser les carnets Neptune ou de créer votre propre carnet Jupyter, comme ceci :

Pour créer un bloc-notes Jupyter à l'aide de Neptune workbench

  1. Assurez-vous que le groupe de sécurité attaché dans le VPC sur lequel s'exécute Neptune dispose d'une règle autorisant les connexions entrantes à partir de SageMaker.

  2. Connectez-vous à la consoleAWSManagement Console et ouvrez la console Amazon Neptune danshttps://console.aws.amazon.com/neptune/home.

  3. Dans le panneau de navigation de gauche, choisissez Bloc-notes.

  4. Choisissez Create Notebook (Créer un bloc-notes).

  5. DansCluster, choisissez votre cluster de base de données Neptune. Si vous n'avez pas encore de cluster de base de données, choisissez Créer un cluster pour en créer un.

  6. Donnez un nom à votre bloc-notes et éventuellement une description.

  7. Sauf si vous avez déjà créé unAWS Identity and Access Management(IAM) pour vos blocs-notes, choisissezCréer un rôle IAMet entrez un nom de rôle IAM.

  8. Choisissez Create Notebook (Créer un bloc-notes). Le processus de création peut prendre de 10 à 15 minutes avant que tout soit prêt.

  9. Une fois votre bloc-notes créé, sélectionnez-le, puis choisissez Ouvrir le bloc-notes.

La console peut créer unAWS Identity and Access Management(IAM) pour vos blocs-notes, ou vous pouvez en créer un vous-même. La stratégie pour ce rôle devrait comprendre les éléments suivants :

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:GetObject", "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::aws-neptune-notebook", "arn:aws:s3:::aws-neptune-notebook/*" ] }, { "Effect": "Allow", "Action": "neptune-db:*", "Resource": [ "your-cluster-arn/*" ] } ] }

En outre, le rôle doit établir la relation de confiance suivante :

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": "sagemaker.amazonaws.com" }, "Action": "sts:AssumeRole" } ] }

Encore une fois, tout préparer peut prendre de 10 à 15 minutes.

Utilisation de Python pour connecter un générique SageMaker bloc-notes Neptune

La connexion d'un ordinateur portable à Neptune est facile si vous avez installé la magie Neptune, mais il est également possible de connecter un SageMaker notebook vers Neptune en utilisant Python, même si vous n'utilisez pas de bloc-notes Neptune.

Étapes à suivre pour se connecter à Neptune dans un SageMaker Bloc-notes Cell

  1. Installez le client Python Gremlin :

    !pip install gremlinpython

    Les notebooks Neptune installent le client Python Gremlin pour vous, donc cette étape n'est nécessaire que si vous utilisez un SageMaker bloc-notes.

  2. Écrivez du code tel que le suivant pour vous connecter et émettre une requête Gremlin :

    from gremlin_python import statics from gremlin_python.structure.graph import Graph from gremlin_python.process.graph_traversal import __ from gremlin_python.process.strategies import * from gremlin_python.driver.driver_remote_connection import DriverRemoteConnection from gremlin_python.driver.aiohttp.transport import AiohttpTransport from gremlin_python.process.traversal import * import os port = 8182 server = '(your server endpoint)' endpoint = f'wss://{server}:{port}/gremlin' graph=Graph() connection = DriverRemoteConnection(endpoint,'g', transport_factory=lambda:AiohttpTransport(call_from_event_loop=True)) g = graph.traversal().withRemote(connection) results = (g.V().hasLabel('airport'). sample(10). order().by('code'). local(__.values('code','city').fold()). toList()) # Print the results in a tabular form with a row index for i,c in enumerate(results,1): print("%3d %4s %s" % (i,c[0],c[1])) connection.close()
Note

Si vous utilisez une version du client Python Gremlin antérieure à la version 3.5.0, cette ligne :

connection = DriverRemoteConnection(endpoint,'g', transport_factory=lambda:AiohttpTransport(call_from_event_loop=True))

Ce serait simplement :

connection = DriverRemoteConnection(endpoint,'g')

Configuration de blocs-notes sur votre machine locale

Le projet de bloc-notes graphique contient des instructions pour configurer les blocs-notes Neptune sur votre machine locale :

Vous pouvez connecter vos blocs-notes locaux soit à un cluster de bases de données Neptune, soit à une instance locale ou distante d'une base de données de graphes open source.

Utilisation de blocs-notes Neptune avec des clusters Neptune

Si vous vous connectez à un cluster Neptune sur le back-end, vous souhaiterez peut-être exécuter les blocs-notes dans Amazon SageMaker. Connexion à Neptune depuis SageMaker peut être plus pratique que depuis une installation locale des ordinateurs portables, et cela vous permettra de travailler plus facilement avecNeptune ML.

Pour obtenir des instructions sur la configuration des blocs-notes dans SageMaker, voirLancement de graph-notebook avec Amazon SageMaker.

Pour savoir comment configurer Neptune lui-même, consultezConfiguration Neptune.

Vous pouvez également connecter une installation locale des notebooks Neptune à un cluster de bases de données Neptune. Cela peut être un peu plus compliqué car les clusters de bases de données Amazon Neptune ne peuvent être créés que dans un Amazon Virtual Private Cloud (VPC), qui est par nature isolé du monde extérieur. Il existe plusieurs manières de se connecter à un VPC depuis l'extérieur. La première consiste à utiliser un équilibreur de charge. Une autre solution consiste à utiliser l'appairage de VPC (consultez laAmazon Virtual Private Cloud Peering Guide).

Cependant, le moyen le plus pratique pour la plupart des utilisateurs est de se connecter pour configurer un serveur proxy Amazon EC2 au sein du VPC, puis d'utiliserTunneling SSH(également appelé port fowarding), pour s'y connecter. Vous pouvez trouver des instructions sur la configuration surConnexion locale du bloc-notes graphique à Amazon Neptunedans leadditional-databases/neptunefolder de la consoleBloc-notes Graph GitHub Project.

Utilisation des blocs-notes Neptune avec des bases de données graphiques open source

Pour démarrer gratuitement avec la technologie graphique, vous pouvez également utiliser les blocs-notes Neptune avec diverses bases de données open source en back-end. Exemples : TinkerPop Serveur Gremlin, et leBlazegraphBase de données.

Pour utiliser Gremlin Server comme base de données principale, suivez les instructions ci-dessous :

Pour utiliser une instance locale deBlazegraphen tant que base de données principale, suivez ces instructions :