一般的なデータ型
一般的なデータ型では、AWS Glue でのその他の一般的なデータ型について説明します。
Tag 構造
Tag
オブジェクトは、AWS リソースに割り当てることができるラベルを表します。タグはそれぞれ、1 つのキーとオプションの 1 つの値で設定されており、どちらもお客様側が定義します。
リソース AWS Glue へのアクセス制御や、AWS タグ AWS Glue および指定 AWS Glue リソース ARN の詳細については、開発者ガイドを参照してください。
フィールド
-
key
– UTF-8 文字列、1~128 バイト長。タグキー。オブジェクトにタグを作成するときにキーが必要です。キーでは大文字と小文字が区別され、プレフィックス aws を含めることはできません。
-
value
- UTF-8 文字列、256 バイト長以下。タグ値。オブジェクトにタグを作成するときの値はオプションです。値では大文字と小文字が区別され、プレフィックス aws を含めることはできません。
DecimalNumber 構造
10 進数形式の数値が含まれます。
フィールド
-
UnscaledValue
– 必須: Blob。スケールされていない数値。
-
Scale
– 必須: 数値 (integer)。スケールされていない値のどの位置に小数点を置くかを決定するスケール。
ErrorDetail 構造
エラーに関する詳細が含まれています。
フィールド
-
ErrorCode
– UTF-8 文字列、1~255 バイト長、Single-line string pattern に一致。このエラーに関連付けられたコード。
-
ErrorMessage
– 説明文字列、2048 バイト長以下、URI address multi-line string pattern に一致。エラーを説明するメッセージ。
PropertyPredicate 構造
プロパティの述語を定義します。
フィールド
-
Key
– Value 文字列、1024 バイト長以下。プロパティのキー。
-
Value
– Value 文字列、1024 バイト長以下。プロパティの値。
-
Comparator
– UTF-8 文字列 (有効な値:EQUALS
|GREATER_THAN
|LESS_THAN
|GREATER_THAN_EQUALS
|LESS_THAN_EQUALS
)。このプロパティを他のプロパティと比較するために使用されたコンパレータ。
ResourceUri 構造
関数リソースの URI。
フィールド
-
ResourceType
– UTF-8 文字列 (有効な値:JAR
|FILE
|ARCHIVE
)。リソースのタイプ。
-
Uri
– Uniform resource identifier (uri)、1~1024 バイト長、URI address multi-line string pattern に一致。リソースにアクセスするための URI。
ColumnStatistics 構造
テーブルまたはパーティションに対して生成された列レベルの統計を表します。
フィールド
-
ColumnName
– 必須: UTF-8 文字列、1~255 バイト長、Single-line string pattern に一致。統計が属する列の名前。
-
ColumnType
– 必須: 型名。20000 バイト長以下。Single-line string pattern に一致。列のデータ型。
-
AnalyzedTime
– 必須: タイムスタンプ。列統計が生成された時点を示すタイムスタンプ。
-
StatisticsData
– 必須: ColumnStatisticsData オブジェクト。統計データ値を含む
ColumnStatisticData
オブジェクト。
ColumnStatisticsError 構造
失敗した ColumnStatistics
オブジェクトと失敗の理由をカプセル化します。
フィールド
-
ColumnStatistics
– ColumnStatistics オブジェクト。列の
ColumnStatistics
。 -
Error
– ErrorDetail オブジェクト。オペレーションが失敗した理由を示すエラーメッセージ。
ColumnError 構造
エラーがある列の名前とエラーの理由について要約します。
フィールド
-
ColumnName
– UTF-8 文字列、1~255 バイト長、Single-line string pattern に一致。エラーがある列の名前。
-
Error
– ErrorDetail オブジェクト。オペレーションが失敗した理由を示すエラーメッセージ。
ColumnStatisticsData 構造
個々のタイプの列統計データが含まれます。Type
属性で 1 つのデータオブジェクトのみを設定し、指示します。
フィールド
-
Type
– 必須: UTF-8 文字列 (有効な値:BOOLEAN
|DATE
|DECIMAL
|DOUBLE
|LONG
|STRING
|BINARY
)。列の統計データの型。
-
BooleanColumnStatisticsData
– BooleanColumnStatisticsData オブジェクト。Boolean の列統計データ。
-
DateColumnStatisticsData
– DateColumnStatisticsData オブジェクト。Date の列統計データ。
-
DecimalColumnStatisticsData
– DecimalColumnStatisticsData オブジェクト。Decimal の列統計データ。内部の UnscaledValue は Base64 でエンコードされたバイナリオブジェクトであり、10 進数のスケーリングされていない値である 2 の補数表現がビッグエンディアンで格納されています。
-
DoubleColumnStatisticsData
– DoubleColumnStatisticsData オブジェクト。Double の列統計データ。
-
LongColumnStatisticsData
– LongColumnStatisticsData オブジェクト。Long の列統計データ。
-
StringColumnStatisticsData
– StringColumnStatisticsData オブジェクト。文字列の列統計データ。
-
BinaryColumnStatisticsData
– BinaryColumnStatisticsData オブジェクト。Binary の列統計データ。
BooleanColumnStatisticsData 構造
Boolean データ列でサポートされる列統計を定義します。
フィールド
-
NumberOfTrues
– 必須: 数値 (long)。None 以下。列内の true の値の数。
-
NumberOfFalses
– 必須: 数値 (long)。None 以下。列内の false の値の数。
-
NumberOfNulls
– 必須: 数値 (long)。None 以下。列内の null 値の数。
DateColumnStatisticsData 構造
タイムスタンプデータ列でサポートされている列統計を定義します。
フィールド
-
MinimumValue
– タイムスタンプ。列内の最小値。
-
MaximumValue
– タイムスタンプ。列内の最大値。
-
NumberOfNulls
– 必須: 数値 (long)。None 以下。列内の null 値の数。
-
NumberOfDistinctValues
– 必須: 数値 (long)。None 以下。列内の異なる値の数です。
DecimalColumnStatisticsData 構造
固定小数点数データ列でサポートされている列統計を定義します。
フィールド
-
MinimumValue
– DecimalNumber オブジェクト。列内の最小値。
-
MaximumValue
– DecimalNumber オブジェクト。列内の最大値。
-
NumberOfNulls
– 必須: 数値 (long)。None 以下。列内の null 値の数。
-
NumberOfDistinctValues
– 必須: 数値 (long)。None 以下。列内の異なる値の数です。
DoubleColumnStatisticsData 構造
浮動小数点数データ列でサポートされている列統計を定義します。
フィールド
-
MinimumValue
– 数値 (double)。列内の最小値。
-
MaximumValue
– 数値 (double)。列内の最大値。
-
NumberOfNulls
– 必須: 数値 (long)。None 以下。列内の null 値の数。
-
NumberOfDistinctValues
– 必須: 数値 (long)。None 以下。列内の異なる値の数です。
LongColumnStatisticsData 構造
整数データ列でサポートされる列統計を定義します。
フィールド
-
MinimumValue
– 数値 (long 型)。列内の最小値。
-
MaximumValue
– 数値 (long 型)。列内の最大値。
-
NumberOfNulls
– 必須: 数値 (long)。None 以下。列内の null 値の数。
-
NumberOfDistinctValues
– 必須: 数値 (long)。None 以下。列内の異なる値の数です。
StringColumnStatisticsData 構造
文字シーケンスのデータ値に対してサポートされる列統計を定義します。
フィールド
-
MaximumLength
– 必須: 数値 (long)。None 以下。列内の最も長い文字列のサイズです。
-
AverageLength
– 必須: 数値 (double)。None 以下。列内の文字列の平均長。
-
NumberOfNulls
– 必須: 数値 (long)。None 以下。列内の null 値の数。
-
NumberOfDistinctValues
– 必須: 数値 (long)。None 以下。列内の異なる値の数です。
BinaryColumnStatisticsData 構造
ビットシーケンスデータ値に対してサポートされる列統計を定義します。
フィールド
-
MaximumLength
– 必須: 数値 (long)。None 以下。列内の最も長いビットシーケンスのサイズ。
-
AverageLength
– 必須: 数値 (double)。None 以下。列内の平均ビットシーケンス長。
-
NumberOfNulls
– 必須: 数値 (long)。None 以下。列内の null 値の数。
文字列パターン
API は、さまざまな文字列パラメータとメンバーの有効コンテンツを定義するために、以下の正規表現を使用します。
単一行文字列パターン – 「
[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\t]*
」URI アドレスの複数行文字列パターン – 「
[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\n\t]*
」Logstash Grok 文字列パターン - 「
[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\t]*
」識別子文字列パターン - 「
[A-Za-z_][A-Za-z0-9_]*
」AWS IAM ARN 文字列パターン - "
arn:aws:iam::\d{12}:role/.*
"バージョン文字列パターン - 「
^[a-zA-Z0-9-_]+$
」ロググループ文字列パターン - 「
[\.\-_/#A-Za-z0-9]+
」ログストリーム文字列パターン - 「
[^:*]*
」カスタム文字列パターン #10 – "
[^\r\n]
"カスタム文字列パターン #11 – "
^arn:aws(-(cn|us-gov|iso(-[bef])?))?:secretsmanager:.*$
"カスタム文字列パターン #12 – "
^(https?)://[-a-zA-Z0-9+&@#/%?=~_|!:,.;]*[-a-zA-Z0-9+&@#/%=~_|]
"カスタム文字列パターン #13 – "
\S+
"カスタム文字列パターン #14 – "
^(https?):\/\/[^\s/$.?#].[^\s]*$
"カスタム文字列パターン #15 – "
^subnet-[a-z0-9]+$
"カスタム文字列パターン #16 – "
[\p{L}\p{N}\p{P}]*
"カスタム文字列パターン #17 – "
[a-f0-9]{8}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{12}
"カスタム文字列パターン #18 – "
[a-zA-Z0-9-_$#.]+
"カスタム文字列パターン #19 – "
^\w+\.\w+\.\w+$
"カスタム文字列パターン #20 – "
^\w+\.\w+$
"カスタム文字列パターン #21 – "
^([2-3]|3[.]9)$
"カスタム文字列パターン #22 – "
arn:(aws|aws-us-gov|aws-cn):glue:.*
"カスタム文字列パターン #23 – "
(^arn:aws:iam::\w{12}:root)
"カスタム文字列パターン #24 – "
^arn:aws(-(cn|us-gov|iso(-[bef])?))?:iam::[0-9]{12}:role/.+
"カスタム文字列パターン #25 – "
arn:aws:kms:.*
"カスタム文字列パターン #26 – "
arn:aws[^:]*:iam::[0-9]*:role/.+
"カスタム文字列パターン #27 – "
[\.\-_A-Za-z0-9]+
"カスタム文字列パターン #28 – "
^s3://([^/]+)/([^/]+/)*([^/]+)$
"カスタム文字列パターン #29 – "
.*
"カスタム文字列パターン #30 – "
^(Sun|Mon|Tue|Wed|Thu|Fri|Sat):([01]?[0-9]|2[0-3])$
"カスタム文字列パターン #31 – "
[a-zA-Z0-9_.-]+
"カスタム文字列パターン #32 – "
[A-Z][A-Za-z\.]+
"カスタム文字列パターン #33 – "
.*\S.*
"カスタム文字列パターン #34 – "
[a-zA-Z0-9-=._/@]+
"カスタム文字列パターン #35 – "
[1-9][0-9]*|[1-9][0-9]*-[1-9][0-9]*
"カスタム文字列パターン #36 – "
[\s\S]*
"カスタム文字列パターン #37 – "
([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'= ;])*
"カスタム文字列パターン #38 – "
^[A-Z\_]+$
"カスタム文字列パターン #39 – "
^[A-Za-z0-9]+$
"カスタム文字列パターン #40 – "
[*A-Za-z0-9_-]*
"カスタム文字列パターン #41 – "
([\u0020-\u007E\r\s\n])*
"カスタム文字列パターン #42 – "
[A-Za-z0-9_-]*
"カスタム文字列パターン #43 – "
([\u0009\u000B\u000C\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF])*
"カスタム文字列パターン #44 – "
([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\s])*
"カスタム文字列パターン #45 – "
([^\r\n])*
"