Formats de chargement de données - Amazon Neptune

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Formats de chargement de données

L'API Amazon Neptune Load permet le chargement de données dans différents formats.

Formats de chargement de graphes de propriétés

Les données chargées dans l'un des formats de graphes de propriétés suivants peuvent être interrogées à l'aide de Gremlin et d'openCypher :

Formats de chargement RDF

Pour charger des données RDF (Resource Description Framework) à interroger avec SPARQL, vous pouvez utiliser l'un des formats standard suivants comme spécifié par W3C (World Wide Web Consortium) :

Les données de chargement doivent utiliser l'encodage UTF-8

Important

Tous les fichiers de chargement de données doivent être encodés au format UTF-8. Si un fichier n'est pas au format UTF-8, Neptune essaie de le charger dans ce format.

Pour les données N-Quads et N-triples comprenant des caractères Unicode, les séquences d'échappement \uxxxxx sont prises en charge. Toutefois, Neptune ne prend pas en charge la normalisation. Si une valeur nécessitant une normalisation est présente, elle ne correspondra pas byte-to-byte lors de la requête. Pour plus d'informations sur la normalisation, consultez la page Normalization sur Unicode.org.

Si vos données ne sont pas dans un format pris en charge, vous devez les convertir avant de les charger.

Un outil permettant de convertir GraphML au format Neptune CSV est disponible dans le projet Graph ML2 CSV sur. GitHub

Prise en charge de la compression des fichiers de chargement de données

Neptune prend en charge la compression des fichiers individuels au format gzip ou bzip2.

Le fichier compressé doit avoir une extension .gz ou .bz2 et doit être un fichier texte encodé unique au format UTF-8. Vous pouvez charger plusieurs fichiers, mais chacun d'entre eux doit être un fichier .gz, .bz2 ou non compressé distinct. Les fichiers d'archive portant des extensions telles que .tar, .tar.gz et .tgz ne sont pas pris en charge.

Les sections suivantes décrivent les formats de façon plus détaillée.