공통 데이터 형식 - AWS Glue

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

공통 데이터 형식

일반적인 데이터 유형은 AWS Glue의 기타 일반적인 데이터 유형에 대해 설명합니다.

태그 구조

Tag객체는 AWS 리소스에 할당할 수 있는 레이블을 나타냅니다. 각 태그는 사용자가 정의하는 키와 선택적 값으로 구성됩니다.

태그와 리소스에 대한 액세스 제어에 대한 자세한 내용은 개발자 가이드의 AWS 태그 AWS Glue 입력 및 AWS Glue 리소스 ARN 지정을 참조하십시오. AWS Glue

필드
  • key – 1~128바이트 길이의 UTF-8 문자열입니다.

    태그 키 객체에서 태그를 생성할 때 이 키는 필수입니다. 이 키는 대/소문자를 구분하며 접두사 aws를 포함해서는 안 됩니다.

  • value – 256바이트 이하 길이의 UTF-8 문자열입니다.

    태그 값 이 값은 객체에서 태그를 생성할 때 선택 사항입니다. 이 값은 대/소문자를 구분하며 접두사 aws를 포함해서는 안 됩니다.

DecimalNumber 구조

십진수 형식의 숫자 값을 포함합니다.

필드
  • UnscaledValue필수(Required): Blob입니다.

    범위가 정해지지 않은 숫자 값.

  • Scale필수(Required): 숫자(정수)입니다.

    범위가 정해지지 않은 값 어디에 십진수가 오는지 결정하는 범위입니다.

ErrorDetail 구조

오류의 세부 정보를 포함합니다.

필드
  • ErrorCodeSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    이 오류와 연결된 코드입니다.

  • ErrorMessageURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    메시지에서 오류를 설명합니다.

PropertyPredicate 구조

속성 조건자를 정의합니다.

필드
  • Key – 1,024바이트 이하 길이의 값 문자열입니다.

    속성 키입니다.

  • Value – 1,024바이트 이하 길이의 값 문자열입니다.

    속성 값입니다.

  • Comparator – UTF-8 문자열입니다(유효 값: EQUALS | GREATER_THAN | LESS_THAN | GREATER_THAN_EQUALS | LESS_THAN_EQUALS).

    비교자는 이 속성을 다른 속성과 비교합니다.

ResourceUri 구조

함수 리소스의 URI입니다.

필드
  • ResourceType – UTF-8 문자열입니다(유효한 값: JAR | FILE | ARCHIVE).

    리소스의 유형.

  • UriURI address multi-line string pattern과(와) 일치하는 1~1,024바이트 길이의 URI(Uniform Resource Identifier)입니다.

    리소스에 액세스하는 URI입니다.

ColumnStatistics 구조

테이블 또는 파티션에 대해 생성된 열 수준 통계를 나타냅니다.

필드
  • ColumnName필수: Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    통계가 속한 열의 이름입니다.

  • ColumnType필수(Required): Single-line string pattern과(와) 일치하는 길이 20,000바이트 이하의 유형 이름입니다.

    열의 데이터 형식.

  • AnalyzedTime필수(Required): 타임스탬프입니다.

    열 통계가 생성된 시간의 타임스탬프입니다.

  • StatisticsData필수(Required): ColumnStatisticsData 객체입니다.

    통계 데이터 값을 포함하는 ColumnStatisticData 객체입니다.

ColumnStatisticsError 구조

실패한 ColumnStatistics 객체와 실패 이유를 캡슐화합니다.

필드
  • ColumnStatisticsColumnStatistics 객체입니다.

    열의 ColumnStatistics입니다.

  • ErrorErrorDetail 객체입니다.

    작업 실패 이유가 포함된 오류 메시지입니다.

ColumnError 구조

실패한 열 이름과 실패 이유를 캡슐화합니다.

필드
  • ColumnNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    실패한 열의 이름입니다.

  • ErrorErrorDetail 객체입니다.

    작업 실패 이유가 포함된 오류 메시지입니다.

ColumnStatisticsData 구조

열 통계 데이터의 개별 유형을 포함합니다. 하나의 데이터 객체만 설정하고 Type 속성으로 표시해야 합니다.

필드
  • Type필수: UTF-8 문자열입니다(유효한 값: BOOLEAN | DATE | DECIMAL | DOUBLE | LONG | STRING | BINARY).

    열 통계 데이터의 유형입니다.

  • BooleanColumnStatisticsDataBooleanColumnStatisticsData 객체입니다.

    부울 열 통계 데이터입니다.

  • DateColumnStatisticsDataDateColumnStatisticsData 객체입니다.

    날짜 열 통계 데이터입니다.

  • DecimalColumnStatisticsDataDecimalColumnStatisticsData 객체입니다.

    10진수 열 통계 데이터. UnscaledValues 내부에는 스케일링되지 않은 십진수 값을 보완하는 빅엔디안인 2를 저장하는 Base64로 인코딩된 이진 객체가 있습니다.

  • DoubleColumnStatisticsDataDoubleColumnStatisticsData 객체입니다.

    실수(Double) 열 통계 데이터입니다.

  • LongColumnStatisticsDataLongColumnStatisticsData 객체입니다.

    정수(Long) 열 통계 데이터입니다.

  • StringColumnStatisticsDataStringColumnStatisticsData 객체입니다.

    문자열 열 통계 데이터입니다.

  • BinaryColumnStatisticsDataBinaryColumnStatisticsData 객체입니다.

    이진수 열 통계 데이터입니다.

BooleanColumnStatisticsData 구조

부울 데이터 열에 대해 지원되는 열 통계를 정의합니다.

필드
  • NumberOfTrues필수: None 이하의 숫자(정수)입니다.

    열의 true 값 수입니다.

  • NumberOfFalses필수(Required): None 이하의 숫자(정수)입니다.

    열의 false 값 수입니다.

  • NumberOfNulls필수(Required): None 이하의 숫자(정수)입니다.

    열의 null 값 수입니다.

DateColumnStatisticsData 구조

타임스탬프 데이터 열에 대해 지원되는 열 통계를 정의합니다.

필드
  • MinimumValue – 타임스탬프입니다.

    열에서 최저 값입니다.

  • MaximumValue – 타임스탬프입니다.

    열에서 최고 값입니다.

  • NumberOfNulls필수(Required): None 이하의 숫자(정수)입니다.

    열의 null 값 수입니다.

  • NumberOfDistinctValues필수(Required): None 이하의 숫자(정수)입니다.

    열의 고유 값 수입니다.

DecimalColumnStatisticsData 구조

고정 소수점 데이터 열에 대해 지원되는 열 통계를 정의합니다.

필드
  • MinimumValueDecimalNumber 객체입니다.

    열에서 최저 값입니다.

  • MaximumValueDecimalNumber 객체입니다.

    열에서 최고 값입니다.

  • NumberOfNulls필수(Required): None 이하의 숫자(정수)입니다.

    열의 null 값 수입니다.

  • NumberOfDistinctValues필수(Required): None 이하의 숫자(정수)입니다.

    열의 고유 값 수입니다.

DoubleColumnStatisticsData 구조

부동 소수점 데이터 열에 대해 지원되는 열 통계를 정의합니다.

필드
  • MinimumValue - 숫자(double)입니다.

    열에서 최저 값입니다.

  • MaximumValue - 숫자(double)입니다.

    열에서 최고 값입니다.

  • NumberOfNulls필수(Required): None 이하의 숫자(정수)입니다.

    열의 null 값 수입니다.

  • NumberOfDistinctValues필수(Required): None 이하의 숫자(정수)입니다.

    열의 고유 값 수입니다.

LongColumnStatisticsData 구조

정수 데이터 열에 대해 지원되는 열 통계를 정의합니다.

필드
  • MinimumValue - 숫자(정수)입니다.

    열에서 최저 값입니다.

  • MaximumValue - 숫자(정수)입니다.

    열에서 최고 값입니다.

  • NumberOfNulls필수(Required): None 이하의 숫자(정수)입니다.

    열의 null 값 수입니다.

  • NumberOfDistinctValues필수(Required): None 이하의 숫자(정수)입니다.

    열의 고유 값 수입니다.

StringColumnStatisticsData 구조

문자 시퀀스 데이터 값에 대해 지원되는 열 통계를 정의합니다.

필드
  • MaximumLength필수: None 이하의 숫자(정수)입니다.

    열에서 가장 긴 문자열의 크기입니다.

  • AverageLength필수(Required): None 이하의 숫자(double)입니다.

    열의 평균 문자열 길이입니다.

  • NumberOfNulls필수(Required): None 이하의 숫자(정수)입니다.

    열의 null 값 수입니다.

  • NumberOfDistinctValues필수(Required): None 이하의 숫자(정수)입니다.

    열의 고유 값 수입니다.

BinaryColumnStatisticsData 구조

비트 시퀀스 데이터 값에 대해 지원되는 열 통계를 정의합니다.

필드
  • MaximumLength필수: None 이하의 숫자(정수)입니다.

    열에서 가장 긴 비트 시퀀스의 크기입니다.

  • AverageLength필수(Required): None 이하의 숫자(double)입니다.

    열의 평균 비트 시퀀스 길이입니다.

  • NumberOfNulls필수(Required): None 이하의 숫자(정수)입니다.

    열의 null 값 수입니다.

문자열 패턴

API는 다음 정규식을 사용하여 다양한 문자열 파라미터 및 멤버의 유효한 값이 무엇인지 정의합니다.

  • 한 줄 문자열 패턴 – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\t]*"

  • URI 주소 여러 줄 문자열 패턴 – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\n\t]*"

  • Logstash Grok 문자열 패턴 – "[\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\r\t]*"

  • 식별자 문자열 패턴 – "[A-Za-z_][A-Za-z0-9_]*"

  • AWS IAM ARN 문자열 패턴 – "arn:aws:iam::\d{12}:role/.*"

  • 버전 문자열 패턴 – "^[a-zA-Z0-9-_]+$"

  • 로그 그룹 문자열 패턴 – "[\.\-_/#A-Za-z0-9]+"

  • 로그 스트림 문자열 패턴 – "[^:*]*"

  • 사용자 정의 문자열 패턴 #10 – "[^\r\n]"

  • 사용자 정의 문자열 패턴 #11 – "[\p{L}\p{N}\p{P}]*"

  • 사용자 정의 문자열 패턴 #12 – "[a-f0-9]{8}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{4}-[a-f0-9]{12}"

  • 사용자 정의 문자열 패턴 #13 – "[a-zA-Z0-9-_$#.]+"

  • 사용자 정의 문자열 패턴 #14 – "^\w+\.\w+\.\w+$"

  • 사용자 정의 문자열 패턴 #15 – "^\w+\.\w+$"

  • 사용자 정의 문자열 패턴 #16 – "^([2-3]|3[.]9)$"

  • 사용자 정의 문자열 패턴 #17 – "arn:(aws|aws-us-gov|aws-cn):glue:.*"

  • 사용자 정의 문자열 패턴 #18 – "(^arn:aws:iam::\w{12}:root)"

  • 사용자 정의 문자열 패턴 #19 – "^arn:aws(-(cn|us-gov|iso(-[bef])?))?:iam::[0-9]{12}:role/.+"

  • 사용자 정의 문자열 패턴 #20 – "arn:aws:kms:.*"

  • 사용자 정의 문자열 패턴 #21 – "arn:aws[^:]*:iam::[0-9]*:role/.+"

  • 사용자 정의 문자열 패턴 #22 – "[\.\-_A-Za-z0-9]+"

  • 사용자 지정 문자열 패턴 #23 – '^s3://([^/]+)/([^/]+/)*([^/]+)$'

  • 사용자 정의 문자열 패턴 #24 – ".*"

  • 사용자 정의 문자열 패턴 #25 – "[a-zA-Z0-9_.-]+"

  • 사용자 정의 문자열 패턴 #26 – ".*\S.*"

  • 사용자 정의 문자열 패턴 #27 – "[a-zA-Z0-9-=._/@]+"

  • 사용자 정의 문자열 패턴 #28 – "[1-9][0-9]*|[1-9][0-9]*-[1-9][0-9]*"

  • 사용자 정의 문자열 패턴 #29 – "[\s\S]*"

  • 사용자 정의 문자열 패턴 #30 – "([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'= ;])*"

  • 사용자 정의 문자열 패턴 #31 – "[*A-Za-z0-9_-]*"

  • 사용자 정의 문자열 패턴 #32 – "([\u0020-\u007E\r\s\n])*"

  • 사용자 정의 문자열 패턴 #33 – "[A-Za-z0-9_-]*"

  • 사용자 지정 문자열 패턴 #34 – "([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n"'])*"

  • 사용자 지정 문자열 패턴 #35 – '([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\S\r\n])*'

  • 사용자 지정 문자열 패턴 #36 — "([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF\s])*

  • 사용자 지정 문자열 패턴 #37 — "([\u0020-\uD7FF\uE000-\uFFFD\uD800\uDC00-\uDBFF\uDFFF]|[^\r\n])*