openCypher データのロード形式 - Amazon Neptune

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

openCypher データのロード形式

openCypher 形式を使用して CSV openCypher データをロードするには、ノードと関係を別々のファイルで指定する必要があります。ローダーは、単一のロードジョブで、これらのノードファイルとリレーションシップファイルの複数のからロードできます。

各ロードコマンドは、ロードされる一連のファイルと同じAmazon Simple Storage Service バケットのパスプレフィックスを持つ必要があります。そのプレフィックスは始点パラメータで指定します。実際のファイル名と拡張子は重要ではありません。

Amazon Neptune では、 openCypher CSV Word形式は RFC 4180 CSV 仕様に準拠しています。詳細については、Internet Engineering Task Force (MIME) ウェブサイトのCSV ファイル用の共通形式と Word タイプ (https://tools.ietf.org/html/rfc4180)」を参照してください。IETF

注記

これらのファイル MUST は UTF-8 形式でエンコードされます。

各ファイルには、システム列ヘッダーとプロパティ列ヘッダーの両方を含むカンマ区切りのヘッダー行があります。

openCypher データロードファイルのシステム列ヘッダー

特定のシステム列は、各ファイルに 1 回のみ表示できます。すべてのシステム列ヘッダーラベルで、大文字と小文字が区別されます。

必須および許可されるシステム列ヘッダーは、openCypher ノードロードファイルとリレーションシップロードファイルで異なります。

ノードファイル内のシステム列ヘッダー

  • :ID — (必須) ノードの ID。

    オプションの ID スペースを :ID(ID Space) のように、ノード :ID 列ヘッダーに追加できます。例は :ID(movies) です。

    このファイル内のノードを接続するリレーションシップをロードするときは、リレーションシップファイルの :START_ID および/または :END_ID 列で同じ ID スペースを使用します。

    ノード :ID はオプションで、フォーム、property name:ID にプロパティとして格納できます。例は name:ID です。

    Node IDs は、現在および以前のロードのすべてのノードファイルで一意である必要があります。ID スペースを使用する場合、ノード IDs は、現在および以前のロードで同じ ID スペースを使用するすべてのノードファイルで一意である必要があります。

  • :LABEL — ノードのラベル。

    複数のラベル値を使用できます。セミコロン (;) で区切ります。

リレーションシップファイル内のシステム列ヘッダー

  • :ID — リレーションシップの ID。これは、userProvidedEdgeIds が true (デフォルト) である場合に必要ですが、userProvidedEdgeIdsfalse の場合は無効となります。

    リレーションシップIDsは、現在および以前のロードのすべてのリレーションシップファイルで一意である必要があります。

  • :START_ID — (必須) このリレーションシップが始まるノードのノード ID。

    必要に応じて、ID スペースをフォーム :START_ID(ID Space) の開始 ID 列に関連付けることができます。開始ノード ID に割り当てられた ID スペースは、ノードファイル内のノードに割り当てられている ID スペースと一致する必要があります。

  • :END_ID — (必須) このリレーションシップが終了するノードのノード ID。

    必要に応じて、ID スペースをフォーム :END_ID(ID Space) の終了 ID 列に関連付けることができます。終了ノード ID に割り当てられた ID スペースは、ノードファイル内のノードに割り当てられた ID スペースと一致する必要があります。

  • :TYPE — リレーションシップのタイプ。リレーションシップには、単一タイプのみを含めることができます。

注記

ノードまたはリレーションシップの重複 IDs が一括ロードプロセスでどのように処理されるかについては、Loading openCypher データ「」を参照してください。

openCypher データロードファイルのプロパティ列ヘッダー

次の形式のプロパティ列ヘッダーを使用して、列が特定のプロパティの値を保持するように指定できます。

propertyname:type

列ヘッダーにはスペース、カンマ、キャリッジリターン、改行文字を使用できないため、プロパティ名にこれらの文字を含めることはできません。以下に示しているのは、タイプ Intage という名前のプロパティの列ヘッダーの例です。

age:Int

列ヘッダーとして age:Int がある列は、すべての行に整数または空の値を含める必要があります。

Neptune openCypher データロードファイルのデータ型

  • Bool または Boolean — ブールフィールド。指定できる値は truefalse です。

    true 以外の値は false として扱われます。

  • Byte-128 から 127 範囲内の整数。

  • Short-32,768 から 32,767 範囲内の整数。

  • Int-2^31 から 2^31 - 1 範囲内の整数。

  • Long-2^63 から 2^63 - 1 範囲内の整数。

  • Float – 32 ビットの IEEE 754 浮動小数点数。十進表記と科学記法の両方がサポートされています。Infinity-Infinity および NaN はすべて認識されますが、INF はされません。

    桁数が多すぎて収まらない値は、最も近い値に丸められます (中間の値は、ビットレベルの最後の残りの桁で 0 に丸められます)。

  • Double – 64 ビットの IEEE 754 浮動小数点数。十進表記と科学記法の両方がサポートされています。Infinity-Infinity および NaN はすべて認識されますが、INF はされません。

    桁数が多すぎて収まらない値は、最も近い値に丸められます (中間の値は、ビットレベルの最後の残りの桁で 0 に丸められます)。

  • String - 引用符はオプションです。カンマ、改行、およびキャリッジリターン文字は、"Hello, World" のような二重引用符 (") で囲まれた文字列に含まれると自動的にエスケープされます。

    引用符で囲まれた文字列に引用符を含めるには、"Hello ""World""" のように、行内で 2 つ使用してください。

  • DateTime – 次のいずれかの ISO-8601 形式の Java 日付。

    • yyyy-MM-dd

    • yyyy-MM-ddTHH:mm

    • yyyy-MM-ddTHH:mm:ss

    • yyyy-MM-ddTHH:mm:ssZ

Neptune openCypher データロードファイルのデータ型を自動キャストする

オートキャストデータ型は、現在 Neptune がネイティブにサポートしていないデータ型をロードするために提供されます。このような列のデータは文字列として保存され、意図した形式に対する検証は行われません。次のオートキャストデータ型を使用できます。

  • CharChar フィールド。文字列として格納されます。

  • DateLocalDate および LocalDateTime、 — datelocaldate および localdatetime タイプの説明については、Neo4j 一時的インスタントを参照してください。値は、検証なしで文字列として逐語的にロードされます。

  • DurationNeo4j デュレーション形式を参照してください。値は、検証なしで文字列として逐語的にロードされます。

  • ポイント — 空間データを格納するためのポイントフィールド。「空間インスタント」を参照してください。値は、検証なしで文字列として逐語的にロードされます。

openCypher ロード形式の例

TinkerPop Modern Graph から取得した次の図は、2 つのノードとリレーションシップの例を示しています。

2 つのノードとそれらのリレーションシップの図表。

以下は、通常の Neptune openCypher ロード形式のグラフです。

ノードファイル:

:ID,name:String,age:Int,lang:String,:LABEL v1,"marko",29,,person v2,"lop",,"java",software

リレーションシップファイル:

:ID,:START_ID(person),:END_ID(software),:TYPE,weight:Double e1,"marko","lop",created,0.4

または、次のようにプロパティとして ID スペースと ID を使用することもできます。

最初のノードファイル:

name:ID(person),age:Int,lang:String,:LABEL "marko",29,,person

2 番目のノードファイル:

name:ID(software),age:Int,lang:String,:LABEL "lop",,"java",software

リレーションシップファイル:

:ID,:START_ID,:END_ID,:TYPE,weight:Double e1,"marko","lop",created,0.4