一般的なデータ型 - AWS Glue

一般的なデータ型

一般的なデータ型では、AWS Glue でのその他の一般的なデータ型について説明します。

Tag 構造

Tag オブジェクトは、AWS リソースに割り当てることができるラベルを表します。タグはそれぞれ、1 つのキーとオプションの 1 つの値で設定されており、どちらもお客様側が定義します。

リソース AWS Glue へのアクセス制御や、AWS タグ AWS Glue および指定 AWS Glue リソース ARN の詳細については、開発者ガイドを参照してください。

フィールド
  • key – UTF-8 文字列、1~128 バイト長。

    タグキー。オブジェクトにタグを作成するときにキーが必要です。キーでは大文字と小文字が区別され、プレフィックス aws を含めることはできません。

  • value - UTF-8 文字列、256 バイト長以下。

    タグ値。オブジェクトにタグを作成するときの値はオプションです。値では大文字と小文字が区別され、プレフィックス aws を含めることはできません。

DecimalNumber 構造

10 進数形式の数値が含まれます。

フィールド
  • UnscaledValue必須: Blob。

    スケールされていない数値。

  • Scale必須: 数値 (integer)。

    スケールされていない値のどの位置に小数点を置くかを決定するスケール。

ErrorDetail 構造

エラーに関する詳細が含まれています。

フィールド

PropertyPredicate 構造

プロパティの述語を定義します。

フィールド
  • Key – Value 文字列、1024 バイト長以下。

    プロパティのキー。

  • Value – Value 文字列、1024 バイト長以下。

    プロパティの値。

  • Comparator – UTF-8 文字列 (有効な値: EQUALS | GREATER_THAN | LESS_THAN | GREATER_THAN_EQUALS | LESS_THAN_EQUALS)。

    このプロパティを他のプロパティと比較するために使用されたコンパレータ。

ResourceUri 構造

関数リソースの URI。

フィールド
  • ResourceType – UTF-8 文字列 (有効な値: JAR | FILE | ARCHIVE)。

    リソースのタイプ。

  • Uri – Uniform resource identifier (uri)、1~1024 バイト長、URI address multi-line string pattern に一致。

    リソースにアクセスするための URI。

ColumnStatistics 構造

テーブルまたはパーティションに対して生成された列レベルの統計を表します。

フィールド
  • ColumnName – 必須: UTF-8 文字列、1~255 バイト長、Single-line string pattern に一致。

    統計が属する列の名前。

  • ColumnType必須: 型名。20000 バイト長以下。Single-line string pattern に一致。

    列のデータ型。

  • AnalyzedTime必須: タイムスタンプ。

    列統計が生成された時点を示すタイムスタンプ。

  • StatisticsData – 必須: ColumnStatisticsData オブジェクト。

    統計データ値を含む ColumnStatisticData オブジェクト。

ColumnStatisticsError 構造

失敗した ColumnStatistics オブジェクトと失敗の理由をカプセル化します。

フィールド
  • ColumnStatisticsColumnStatistics オブジェクト。

    列の ColumnStatistics

  • ErrorErrorDetail オブジェクト。

    オペレーションが失敗した理由を示すエラーメッセージ。

ColumnError 構造

エラーがある列の名前とエラーの理由について要約します。

フィールド
  • ColumnName – UTF-8 文字列、1~255 バイト長、Single-line string pattern に一致。

    エラーがある列の名前。

  • ErrorErrorDetail オブジェクト。

    オペレーションが失敗した理由を示すエラーメッセージ。

ColumnStatisticsData 構造

個々のタイプの列統計データが含まれます。Type 属性で 1 つのデータオブジェクトのみを設定し、指示します。

フィールド
  • Type必須: UTF-8 文字列 (有効な値: BOOLEAN | DATE | DECIMAL | DOUBLE | LONG | STRING | BINARY)。

    列の統計データの型。

  • BooleanColumnStatisticsDataBooleanColumnStatisticsData オブジェクト。

    Boolean の列統計データ。

  • DateColumnStatisticsDataDateColumnStatisticsData オブジェクト。

    Date の列統計データ。

  • DecimalColumnStatisticsDataDecimalColumnStatisticsData オブジェクト。

    Decimal の列統計データ。内部の UnscaledValue は Base64 でエンコードされたバイナリオブジェクトであり、10 進数のスケーリングされていない値である 2 の補数表現がビッグエンディアンで格納されています。

  • DoubleColumnStatisticsDataDoubleColumnStatisticsData オブジェクト。

    Double の列統計データ。

  • LongColumnStatisticsDataLongColumnStatisticsData オブジェクト。

    Long の列統計データ。

  • StringColumnStatisticsDataStringColumnStatisticsData オブジェクト。

    文字列の列統計データ。

  • BinaryColumnStatisticsDataBinaryColumnStatisticsData オブジェクト。

    Binary の列統計データ。

BooleanColumnStatisticsData 構造

Boolean データ列でサポートされる列統計を定義します。

フィールド
  • NumberOfTrues必須: 数値 (long)。None 以下。

    列内の true の値の数。

  • NumberOfFalses必須: 数値 (long)。None 以下。

    列内の false の値の数。

  • NumberOfNulls必須: 数値 (long)。None 以下。

    列内の null 値の数。

DateColumnStatisticsData 構造

タイムスタンプデータ列でサポートされている列統計を定義します。

フィールド
  • MinimumValue – タイムスタンプ。

    列内の最小値。

  • MaximumValue – タイムスタンプ。

    列内の最大値。

  • NumberOfNulls必須: 数値 (long)。None 以下。

    列内の null 値の数。

  • NumberOfDistinctValues必須: 数値 (long)。None 以下。

    列内の異なる値の数です。

DecimalColumnStatisticsData 構造

固定小数点数データ列でサポートされている列統計を定義します。

フィールド
  • MinimumValueDecimalNumber オブジェクト。

    列内の最小値。

  • MaximumValueDecimalNumber オブジェクト。

    列内の最大値。

  • NumberOfNulls必須: 数値 (long)。None 以下。

    列内の null 値の数。

  • NumberOfDistinctValues必須: 数値 (long)。None 以下。

    列内の異なる値の数です。

DoubleColumnStatisticsData 構造

浮動小数点数データ列でサポートされている列統計を定義します。

フィールド
  • MinimumValue – 数値 (double)。

    列内の最小値。

  • MaximumValue – 数値 (double)。

    列内の最大値。

  • NumberOfNulls必須: 数値 (long)。None 以下。

    列内の null 値の数。

  • NumberOfDistinctValues必須: 数値 (long)。None 以下。

    列内の異なる値の数です。

LongColumnStatisticsData 構造

整数データ列でサポートされる列統計を定義します。

フィールド
  • MinimumValue – 数値 (long 型)。

    列内の最小値。

  • MaximumValue – 数値 (long 型)。

    列内の最大値。

  • NumberOfNulls必須: 数値 (long)。None 以下。

    列内の null 値の数。

  • NumberOfDistinctValues必須: 数値 (long)。None 以下。

    列内の異なる値の数です。

StringColumnStatisticsData 構造

文字シーケンスのデータ値に対してサポートされる列統計を定義します。

フィールド
  • MaximumLength必須: 数値 (long)。None 以下。

    列内の最も長い文字列のサイズです。

  • AverageLength必須: 数値 (double)。None 以下。

    列内の文字列の平均長。

  • NumberOfNulls必須: 数値 (long)。None 以下。

    列内の null 値の数。

  • NumberOfDistinctValues必須: 数値 (long)。None 以下。

    列内の異なる値の数です。

BinaryColumnStatisticsData 構造

ビットシーケンスデータ値に対してサポートされる列統計を定義します。

フィールド
  • MaximumLength必須: 数値 (long)。None 以下。

    列内の最も長いビットシーケンスのサイズ。

  • AverageLength必須: 数値 (double)。None 以下。

    列内の平均ビットシーケンス長。

  • NumberOfNulls必須: 数値 (long)。None 以下。

    列内の null 値の数。

文字列パターン

API は、さまざまな文字列パラメータとメンバーの有効コンテンツを定義するために、以下の正規表現を使用します。

  • 単一行文字列パターン – 「[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\t]*

  • URI アドレスの複数行文字列パターン – 「[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\n\t]*

  • Logstash Grok 文字列パターン - 「[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\t]*

  • 識別子文字列パターン - 「[A-Za-z_][A-Za-z0-9_]*

  • AWS IAM ARN 文字列パターン - "arn:aws:iam::\d{12}:role/.*"

  • バージョン文字列パターン - 「^[a-zA-Z0-9-_]+$

  • ロググループ文字列パターン - 「[\.\-_/#A-Za-z0-9]+

  • ログストリーム文字列パターン - 「[^:*]*

  • カスタム文字列パターン #10 – "[^\r\n]"

  • カスタム文字列パターン #11 – "^arn:aws(-(cn|us-gov|iso(-[bef])?))?:secretsmanager:.*$"

  • カスタム文字列パターン #12 – "^(https?)://[-a-zA-Z0-9+&@#/%?=~_|!:,.;]*[-a-zA-Z0-9+&@#/%=~_|]"

  • カスタム文字列パターン #13 – "\S+"

  • カスタム文字列パターン #14 – "^(https?):\/\/[^\s/$.?#].[^\s]*$"

  • カスタム文字列パターン #15 – "^subnet-[a-z0-9]+$"

  • カスタム文字列パターン #16 – "[\p{L}\p{N}\p{P}]*"

  • カスタム文字列パターン #17 – "[a-f0-9]{8}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{12}"

  • カスタム文字列パターン #18 – "[a-zA-Z0-9-_$#.]+"

  • カスタム文字列パターン #19 – "^\w+\.\w+\.\w+$"

  • カスタム文字列パターン #20 – "^\w+\.\w+$"

  • カスタム文字列パターン #21 – "^([2-3]|3[.]9)$"

  • カスタム文字列パターン #22 – "arn:(aws|aws-us-gov|aws-cn):glue:.*"

  • カスタム文字列パターン #23 – "(^arn:aws:iam::\w{12}:root)"

  • カスタム文字列パターン #24 – "^arn:aws(-(cn|us-gov|iso(-[bef])?))?:iam::[0-9]{12}:role/.+"

  • カスタム文字列パターン #25 – "arn:aws:kms:.*"

  • カスタム文字列パターン #26 – "arn:aws[^:]*:iam::[0-9]*:role/.+"

  • カスタム文字列パターン #27 – "[\.\-_A-Za-z0-9]+"

  • カスタム文字列パターン #28 – "^s3://([^/]+)/([^/]+/)*([^/]+)$"

  • カスタム文字列パターン #29 – ".*"

  • カスタム文字列パターン #30 – "^(Sun|Mon|Tue|Wed|Thu|Fri|Sat):([01]?[0-9]|2[0-3])$"

  • カスタム文字列パターン #31 – "[a-zA-Z0-9_.-]+"

  • カスタム文字列パターン #32 – "[A-Z][A-Za-z\.]+"

  • カスタム文字列パターン #33 – ".*\S.*"

  • カスタム文字列パターン #34 – "[a-zA-Z0-9-=._/@]+"

  • カスタム文字列パターン #35 – "[1-9][0-9]*|[1-9][0-9]*-[1-9][0-9]*"

  • カスタム文字列パターン #36 – "[\s\S]*"

  • カスタム文字列パターン #37 – "([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'= ;])*"

  • カスタム文字列パターン #38 – "^[A-Z\_]+$"

  • カスタム文字列パターン #39 – "^[A-Za-z0-9]+$"

  • カスタム文字列パターン #40 – "[*A-Za-z0-9_-]*"

  • カスタム文字列パターン #41 – "([\u0020-\u007E\r\s\n])*"

  • カスタム文字列パターン #42 – "[A-Za-z0-9_-]*"

  • カスタム文字列パターン #43 – "([\u0009\u000B\u000C\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF])*"

  • カスタム文字列パターン #44 – "([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\s])*"

  • カスタム文字列パターン #45 – "([^\r\n])*"