Qu'est-ce qu'Amazon Neptune ? - Amazon Neptune

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Qu'est-ce qu'Amazon Neptune ?

Amazon Neptune est un service de base de données orientée graphe entièrement géré et fiable, qui facilite la création et l’exécution d’applications fonctionnant avec des jeux de données hautement connectés. Le cœur de Neptune est un moteur de base de données orientée graphe spécialisé et hautes performances. Ce moteur est optimisé pour le stockage de milliards de relations et l'interrogation du graphe avec une latence de l'ordre de quelques millisecondes. Neptune prend en charge les langages de requête de graphes de propriétés populaires Apache TinkerPop Gremlin et openCypher de Neo4j, ainsi que le langage de requête RDF du W3C, SPARQL. Cela vous permet de créer des requêtes qui naviguent efficacement dans les jeux de données hautement connectés. Neptune est destiné aux cas d'utilisation axés sur les graphes, comme les moteurs de recommandation, la détection des fraudes, les graphes de connaissances, la découverte de médicaments et la sécurité du réseau.

La base de données Neptune est hautement disponible grâce aux réplicas en lecture, à la PITR, à la sauvegarde continue sur Amazon S3 et à la réplication entre les zones de disponibilité. Neptune offre des fonctionnalités de sécurité des données avec prise en charge du chiffrement au repos et en transit. Neptune est entièrement géré. Vous n'avez donc plus besoin de vous soucier des tâches de gestion de base de données, comme le provisionnement de matériel, l'application de correctifs logiciels, l'installation, la configuration ou les sauvegardes.

Neptune Analytics est un moteur de base de données analytique qui complète la base de données Neptune et qui peut analyser rapidement de grandes quantités de données graphiques en mémoire pour obtenir des informations et identifier des tendances. Neptune Analytics est une solution permettant d’analyser rapidement les bases de données orientées graphe existantes ou les jeux de données de graphes stockés dans un lac de données. Elle utilise des algorithmes d’analyse de graphes populaires et des requêtes analytiques à faible latence.

Pour plus d'informations sur Amazon Neptune, nous vous conseillons de commencer par les sections suivantes :

Si vous faites vos premiers pas dans le domaine des graphes ou si vous n'êtes pas encore prêt à investir dans un environnement de production Neptune complet, consultez la rubrique Démarrer afin de découvrir comment utiliser les blocs-notes Neptune Jupyter pour apprendre et développer sans frais supplémentaires.

Avant de démarrer la conception de votre base de données, nous vous recommandons également de consulter le référentiel GitHub Architectures de référence AWS pour l'utilisation de bases de données orientées graphe. Vous y trouverez des informations sur les modèles de données de graphe et les langages de requête, et vous pourrez parcourir les exemples d'architectures de déploiement de référence.

Principaux composants du service
  • Instance de base de données principale : prend en charge les opérations de lecture et d'écriture, et effectue toutes les modifications de données du volume de cluster. Chaque cluster de bases de données Neptune possède une instance de base de données principale qui est responsable de l'écriture (c'est-à-dire, du chargement ou de la modification) des contenus de base de données orientée graphe.

  • Réplica Neptune : se connecte au même volume de stockage que l'instance de base de données principale et prend uniquement en charge les opérations de lecture. Chaque cluster de base de données Neptune peut contenir jusqu'à 15 réplicas Neptune en plus de l'instance de base de données principale. Cela procure une haute disponibilité par la localisation des réplicas Neptune dans des zones de disponibilité distinctes et une charge de distribution à partir des clients de lecture.

  • Volume de cluster : les données Neptune sont stockées dans le volume de cluster, qui a été pensé pour offrir fiabilité et haute disponibilité. Un volume de cluster se compose de copies des données sur plusieurs zones de disponibilité d'une même région AWS. Comme vos données sont automatiquement répliquées dans toutes les zones de disponibilité, elles sont hautement durables et le risque de perte des données est très faible.

Prise en charge des API de graphe open source

Amazon Neptune prend en charge les API ouvertes pour les graphes de propriétés (Gremlin et openCypher) et les graphes RDF (SPARQL). Il fournit des performances élevées pour ces deux modèles de graphes et leurs langages de requête. Vous pouvez choisir le modèle de graphe de propriétés (PG) et accéder au même graphe avec le langage de requête openCypher et/ou le langage de requête Gremlin. Si vous utilisez le modèle RDF (Resource Description Framework) standard du W3C, vous pouvez accéder à votre graphe à l'aide du langage de requête SPARQL standard.

Hautement sécurisé

Neptune propose plusieurs niveaux de sécurité pour votre base de données. Les fonctionnalités de sécurité incluent l'isolement réseau avec Amazon VPC, ainsi que le chiffrement au repos avec des clés que vous créez et contrôlez via AWS Key Management Service (AWS KMS). Dans une instance Neptune chiffrée, les données du stockage sous-jacent sont chiffrées, de même que les sauvegardes automatiques, les instantanés et les réplicas dans le même cluster.

Entièrement géré

Grâce à Amazon Neptune, vous n'avez plus besoin de vous soucier des tâches de gestion de base de données, comme le provisionnement de matériel, l'application de correctifs logiciels, l'installation, la configuration et les sauvegardes.

Vous pouvez utiliser Neptune pour créer des applications de graphe sophistiquées interactives capables d'interroger des milliards de relations en quelques millisecondes. Les requêtes SQL pour les données hautement connectées sont complexes et difficiles à ajuster pour obtenir des performances optimales. Neptune vous permet d'utiliser les langages de requête de graphe populaires Gremlin, openCypher et SPARQL pour exécuter des requêtes puissantes qui sont faciles à écrire et efficaces avec des données connectées. Cette fonctionnalité réduit considérablement la complexité du code, ce qui vous permet de créer rapidement des applications qui traitent les relations.

Neptune est conçu pour offrir une disponibilité supérieure à 99,99 %. Ce service améliore les performances et la disponibilité des bases de données en intégrant au moteur de base de données une couche de stockage SSD virtualisé conçue pour les charges de travail de base de données. Stockage tolérant aux pannes et auto-réparable. Les défaillances de disque sont réparées en arrière-plan sans perte de disponibilité de la base de données. Neptune détecte automatiquement les incidents de base de données et redémarre sans effectuer de récupération sur incident et sans regénérer le cache de la base de données. Si l'instance échoue dans son ensemble, Neptune bascule automatiquement vers l'un des 15 réplicas en lecture.