테이블 API - AWS Glue

테이블 API

테이블 API는 테이블과 관련된 데이터 형식 및 작업에 대해 설명합니다.

데이터 유형

테이블 구조

행과 열에 조직된 관련 데이터 모음을 보여줍니다.

필드
  • Name필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블 이름입니다. 반드시 모두 소문자로 저장하여 Hive 호환성을 유지하도록 합니다.

  • DatabaseNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블 메타데이터가 있는 데이터베이스의 이름입니다. 반드시 모두 소문자로 저장하여 Hive 호환성을 유지하도록 합니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    테이블에 대한 설명입니다.

  • OwnerSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블의 소유자입니다.

  • CreateTime – 타임스탬프입니다.

    테이블 정의가 데이터 카탈로그에 생성된 시간입니다.

  • UpdateTime – 타임스탬프입니다.

    테이블이 업데이트된 마지막 시간입니다.

  • LastAccessTime – 타임스탬프입니다.

    테이블이 액세스된 마지막 시간입니다. 보통 HDFS에서 가져왔고 대다수는 신뢰할 만하지 않습니다.

  • LastAnalyzedTime – 타임스탬프입니다.

    이 테이블에 대한 열 통계가 계산된 마지막 시간입니다.

  • Retention – None 이하의 숫자(정수)입니다.

    이 테이블의 보관 기간입니다.

  • StorageDescriptorStorageDescriptor 객체입니다.

    이 테이블의 물리적 스토리지에 대한 정보를 포함하는 스토리지 서술자입니다.

  • PartitionKeys 객체의 배열입니다.

    테이블을 분할할 열의 목록입니다. 초기 유형만 파티션 키로써 지원됩니다.

    Amazon Athena에서 사용하는 테이블을 생성할 때 partitionKeys를 지정하지 않은 경우, 최소한 값 partitionKeys를 빈 목록으로 설정해야 합니다. 예:

    "PartitionKeys": []

  • ViewOriginalText – 409,600바이트 이하 길이의 UTF-8 문자열입니다.

    테이블이 보기인 경우 해당 보기의 원래 텍스트이고 그렇지 않으면 null입니다.

  • ViewExpandedText – 409,600바이트 이하 길이의 UTF-8 문자열입니다.

    테이블이 보기인 경우 해당 보기의 확장된 텍스트이고 그렇지 않으면 null입니다.

  • TableType – 255바이트 이하 길이의 UTF-8 문자열입니다.

    이 테이블 유형(EXTERNAL_TABLE, VIRTUAL_VIEW 등).

  • Parameters – 키-값 페어의 맵 배열입니다.

    각 키는 Single-line string pattern과(와) 일치하는 1~255 바이트 길이의 키 문자열입니다.

    각 값은 512000 바이트 이하 길이의 UTF-8 문자열입니다.

    이러한 키-값 쌍은 테이블과 관련된 속성을 정의합니다.

  • CreatedBySingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블을 만든 사용자 혹은 개체.

  • IsRegisteredWithLakeFormation – 부울입니다.

    테이블이 AWS Lake Formation에 등록되었는지 여부를 나타냅니다.

  • TargetTableTableIdentifier 객체입니다.

    리소스 링크에 대한 대상 테이블을 설명하는 TableIdentifier 구조입니다.

  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 위치한 데이터 카탈로그의 ID입니다.

  • VersionIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블 버전의 ID입니다.

TableInput 구조

테이블을 정의하는 데 사용된 구조입니다.

필드
  • Name필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블 이름입니다. 저장될 때 소문자로 저장되어 Hive 호환성을 유지합니다.

  • DescriptionURI address multi-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 설명 문자열입니다.

    테이블에 대한 설명입니다.

  • OwnerSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블 소유자입니다.

  • LastAccessTime – 타임스탬프입니다.

    테이블이 액세스된 마지막 시간입니다.

  • LastAnalyzedTime – 타임스탬프입니다.

    이 테이블에 대한 열 통계가 계산된 마지막 시간입니다.

  • Retention – None 이하의 숫자(정수)입니다.

    이 테이블의 보관 기간입니다.

  • StorageDescriptorStorageDescriptor 객체입니다.

    이 테이블의 물리적 스토리지에 대한 정보를 포함하는 스토리지 서술자입니다.

  • PartitionKeys 객체의 배열입니다.

    테이블을 분할할 열의 목록입니다. 초기 유형만 파티션 키로써 지원됩니다.

    Amazon Athena에서 사용하는 테이블을 생성할 때 partitionKeys를 지정하지 않은 경우, 최소한 값 partitionKeys를 빈 목록으로 설정해야 합니다. 예:

    "PartitionKeys": []

  • ViewOriginalText – 409,600바이트 이하 길이의 UTF-8 문자열입니다.

    테이블이 보기인 경우 해당 보기의 원래 텍스트이고 그렇지 않으면 null입니다.

  • ViewExpandedText – 409,600바이트 이하 길이의 UTF-8 문자열입니다.

    테이블이 보기인 경우 해당 보기의 확장된 텍스트이고 그렇지 않으면 null입니다.

  • TableType – 255바이트 이하 길이의 UTF-8 문자열입니다.

    이 테이블 유형(EXTERNAL_TABLE, VIRTUAL_VIEW 등).

  • Parameters – 키-값 페어의 맵 배열입니다.

    각 키는 Single-line string pattern과(와) 일치하는 1~255 바이트 길이의 키 문자열입니다.

    각 값은 512000 바이트 이하 길이의 UTF-8 문자열입니다.

    이러한 키-값 쌍은 테이블과 관련된 속성을 정의합니다.

  • TargetTableTableIdentifier 객체입니다.

    리소스 링크에 대한 대상 테이블을 설명하는 TableIdentifier 구조입니다.

열 구조

Table의 열.

필드
  • Name필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    Column의 이름입니다.

  • TypeSingle-line string pattern과(와) 일치하는 131,072바이트 이하 길이의 UTF-8 문자열입니다.

    Column의 데이터 형식입니다.

  • CommentSingle-line string pattern과(와) 일치하는 255바이트 이하 길이의 주석 문자열입니다.

    자유 형식의 텍스트 설명.

  • Parameters – 키-값 페어의 맵 배열입니다.

    각 키는 Single-line string pattern과(와) 일치하는 1~255 바이트 길이의 키 문자열입니다.

    각 값은 512000 바이트 이하 길이의 UTF-8 문자열입니다.

    이러한 키-값 페어는 열과 관련된 속성을 정의합니다.

StorageDescriptor 구조

테이블 데이터의 물리적 스토리지를 설명합니다.

필드
  • Columns 객체의 배열입니다.

    테이블의 Columns 목록입니다.

  • LocationURI address multi-line string pattern과(와) 일치하는 2,056바이트 이하 길이의 위치 문자열입니다.

    테이블의 물리적 위치입니다. 기본적으로 웨어하우스 위치, 웨어하우스의 데이터베이스 위치, 테이블 이름 순으로 나타납니다.

  • AdditionalLocations – UTF-8 문자열의 배열입니다.

    Delta 테이블이 위치한 경로를 가리키는 위치 목록입니다.

  • InputFormatSingle-line string pattern과(와) 일치하는 128바이트 이하 길이의 포맷 문자열입니다.

    입력 형식: SequenceFileInputFormat(이진), TextInputFormat 또는 사용자 지정 형식입니다.

  • OutputFormatSingle-line string pattern과(와) 일치하는 128바이트 이하 길이의 포맷 문자열입니다.

    출력 형식: SequenceFileOutputFormat(이진), IgnoreKeyTextOutputFormat 또는 사용자 지정 형식입니다.

  • Compressed – 부울입니다.

    테이블의 데이터가 압축되면 True이고 그렇지 않으면 False입니다.

  • NumberOfBuckets - 숫자(정수)입니다.

    테이블에 차원 열이 포함되어 있는 경우 이 속성을 지정해야 합니다.

  • SerdeInfoSerDeInfo 객체입니다.

    직렬화/역직렬화(SerDe) 정보입니다.

  • BucketColumns – UTF-8 문자열의 배열입니다.

    테이블의 열, 클러스터링 열 및 버킷 열을 지정하는 그룹화하는 reducer 목록입니다.

  • SortColumnsOrder 객체의 배열입니다.

    테이블에 있는 각 버킷의 정렬 순서를 지정하는 목록입니다.

  • Parameters – 키-값 페어의 맵 배열입니다.

    각 키는 Single-line string pattern과(와) 일치하는 1~255 바이트 길이의 키 문자열입니다.

    각 값은 512000 바이트 이하 길이의 UTF-8 문자열입니다.

    키 값 형식의 사용자 제공 속성입니다.

  • SkewedInfoSkewedInfo 객체입니다.

    열에 자주 표시되는 값에 대한 정보입니다(편향된 값).

  • StoredAsSubDirectories – 부울입니다.

    테이블 데이터가 하위 디렉터리에 저장되면 True이고 그렇지 않으면 False입니다.

  • SchemaReferenceSchemaReference 객체입니다.

    AWS Glue Schema Registry에 저장된 스키마를 참조하는 객체입니다.

    테이블을 생성할 때 스키마에 대한 빈 열 목록을 전달하고, 대신 스키마 참조를 사용할 수 있습니다.

SchemaReference 구조

AWS Glue Schema Registry에 저장된 스키마를 참조하는 객체입니다.

필드
  • SchemaIdSchemaId 객체입니다.

    스키마 ID 필드를 포함하는 구조입니다. 이것 또는 SchemaVersionId가 제공되어야 합니다.

  • SchemaVersionIdCustom string pattern #12과(와) 일치하는 36바이트 이상 길이의 UTF-8 문자열입니다.

    스키마 버전에 할당된 고유 ID입니다. 이것 또는 SchemaId가 제공되어야 합니다.

  • SchemaVersionNumber - 1~100,000의 숫자(정수)입니다.

    스키마의 버전 번호입니다.

SerDeInfo 구조

추출기 및 로더 역할을 하는 직렬화/역직렬화 프로그램(SerDe)에 대한 정보입니다.

필드
  • NameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    SerDe의 이름입니다.

  • SerializationLibrarySingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    일반적으로 SerDe를 구현하는 클래스입니다. 예를 들면, org.apache.hadoop.hive.serde2.columnar.ColumnarSerDe입니다.

  • Parameters – 키-값 페어의 맵 배열입니다.

    각 키는 Single-line string pattern과(와) 일치하는 1~255 바이트 길이의 키 문자열입니다.

    각 값은 512000 바이트 이하 길이의 UTF-8 문자열입니다.

    이러한 키-값 쌍은 SerDe의 초기화 파라미터를 정의합니다.

Order 구조

분류된 열의 정렬 순서를 지정합니다.

필드
  • Column필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    열의 이름입니다.

  • SortOrder필수(Required): 1 이하의 숫자(정수)입니다.

    열이 오름차순(== 1) 또는 내림차순(==0)으로 정렬된 것을 나타냅니다.

SkewedInfo 구조

테이블에 왜곡된 값을 지정합니다. 왜곡된 값은 매우 높은 빈도를 통해 발생한 값입니다.

필드
  • SkewedColumnNames – UTF-8 문자열의 배열입니다.

    왜곡된 값이 포함된 열의 이름 목록입니다.

  • SkewedColumnValues – UTF-8 문자열의 배열입니다.

    너무 자주 나타나서 왜곡된 것으로 간주되는 값의 목록입니다.

  • SkewedColumnValueLocationMaps – 키-값 페어의 맵 배열입니다.

    각 키는 UTF-8 문자열입니다.

    각 값은 UTF-8 문자열입니다.

    왜곡된 값을 이 값을 포함하는 열에 매핑.

TableVersion 구조

테이블 버전을 지정합니다.

필드
  • Table 객체입니다.

    문제의 테이블입니다.

  • VersionIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    이 테이블 버전을 식별하는 ID 값. VersionId는 정수의 문자열 표현입니다. 각 버전은 1씩 증가합니다.

TableError 구조

테이블 작업의 오류 기록.

필드
  • TableNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블의 이름. 반드시 모두 소문자로 저장하여 Hive 호환성을 유지하도록 합니다.

  • ErrorDetailErrorDetail 객체입니다.

    오류에 대한 세부 정보입니다.

TableVersionError 구조

테이블 버전 작업의 오류 기록.

필드
  • TableNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    문제의 테이블 이름입니다.

  • VersionIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    문제의 버전 ID 값입니다. VersionID는 정수의 문자열 표현입니다. 각 버전은 1씩 증가합니다.

  • ErrorDetailErrorDetail 객체입니다.

    오류에 대한 세부 정보입니다.

SortCriterion 구조

정렬 기준 필드와 정렬 순서를 지정합니다.

필드
  • FieldName – 1,024바이트 이하 길이의 값 문자열입니다.

    정렬할 필드의 이름입니다.

  • Sort – UTF-8 문자열입니다(유효 값: ASC="ASCENDING" | DESC="DESCENDING").

    오름차순 또는 내림차순 정렬.

TableIdentifier 구조

리소스 링크에 대한 대상 테이블을 설명하는 구조입니다.

필드
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 위치한 데이터 카탈로그의 ID입니다.

  • DatabaseNameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    대상 테이블을 포함하는 카탈로그 데이터베이스의 이름입니다.

  • NameSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    대상 테이블의 이름입니다.

KeySchemaElement 구조

이름과 유형으로 구성된 파티션 키 페어입니다.

필드
  • Name필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    파티션 키의 이름입니다.

  • Type필수(Required): Single-line string pattern과(와) 일치하는 131,072바이트 이하 길이의 UTF-8 문자열입니다.

    파티션 키의 유형입니다.

PartitionIndex 구조

파티션 인덱스의 구조입니다.

필드
  • Keys필수(Required): UTF-8 문자열의 배열이며 문자열은 1개 이상입니다.

    파티션 인덱스의 키입니다.

  • IndexName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    파티션 인덱스의 이름입니다.

PartitionIndexDescriptor 구조

테이블의 파티션 인덱스에 대한 설명자입니다.

필드
  • IndexName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    파티션 인덱스의 이름입니다.

  • Keys필수(Required): KeySchemaElement 객체의 배열로 구조가 1개 이상입니다.

    파티션 인덱스에 대한 하나 이상의 키 목록(KeySchemaElement 구조)입니다.

  • IndexStatus필수(Required): UTF-8 문자열입니다(유효 값: CREATING | ACTIVE | DELETING | FAILED).

    파티션 인덱스의 상태입니다.

    가능한 상태는 다음과 같습니다.

    • [생성 중(CREATING)]: 인덱스를 생성 중입니다. 인덱스가 [생성 중(CREATING)] 상태인 경우 인덱스 또는 해당 테이블을 삭제할 수 없습니다.

    • [활성(ACTIVE)]: 인덱스 생성에 성공했습니다.

    • [실패(FAILED)]: 인덱스 생성에 실패했습니다.

    • [삭제 중(DELETING)]: 인덱스 목록에서 인덱스를 삭제합니다.

  • BackfillErrorsBackfillError 객체의 배열입니다.

    기존 테이블에 대한 파티션 인덱스를 등록할 때 발생할 수 있는 오류 목록입니다.

BackfillError 구조

기존 테이블에 대한 파티션 인덱스를 등록할 때 발생할 수 있는 오류 목록입니다.

이러한 오류는 인덱스 등록이 실패한 이유에 대한 세부 정보를 제공하고 응답에 제한된 수의 파티션을 제공하므로 결함이 있는 파티션을 수정하고 인덱스 등록을 다시 시도할 수 있습니다. 발생할 수 있는 가장 일반적인 오류 집합은 다음과 같이 분류됩니다.

  • EncryptedPartitionError: 파티션이 암호화되었습니다.

  • InvalidPartitionTypeDataError: 파티션 값이 해당 파티션 열의 데이터 유형과 일치하지 않습니다.

  • MissingPartitionValueError: 파티션이 암호화되었습니다.

  • UnsupportedPartitionCharacterError: 파티션 값 내의 문자는 지원되지 않습니다. 예: U+0000 , U+0001, U+0002.

  • InternalError: 다른 오류 코드에 속하지 않는 모든 오류입니다.

필드
  • Code – UTF-8 문자열입니다(유효한 값: ENCRYPTED_PARTITION_ERROR | INTERNAL_ERROR | INVALID_PARTITION_TYPE_DATA_ERROR | MISSING_PARTITION_VALUE_ERROR | UNSUPPORTED_PARTITION_CHARACTER_ERROR).

    기존 테이블에 대한 파티션 인덱스를 등록할 때 발생한 오류에 대한 오류 코드입니다.

  • PartitionsPartitionValueList 객체의 배열입니다.

    응답의 제한된 수의 파티션 목록입니다.

작업

CreateTable 작업(Python: create_table)

데이터 카탈로그에서 새로운 테이블 정의를 생성합니다.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    Table을 생성할 데이터 카탈로그의 ID입니다. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    새로운 테이블을 생성할 카탈로그 데이터베이스입니다. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • TableInput필수(Required): TableInput 객체입니다.

    TableInput 객체는 카탈로그에 생성할 메타데이터 테이블을 정의합니다.

  • PartitionIndexesPartitionIndex 객체의 배열이며 구조는 3개 이하입니다.

    테이블에 생성할 파티션 인덱스(PartitionIndex 구조)의 목록입니다.

  • TransactionIdCustom string pattern #11과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    트랜잭션의 ID입니다.

응답
  • 무응답 파라미터.

오류
  • AlreadyExistsException

  • InvalidInputException

  • EntityNotFoundException

  • ResourceNumberLimitExceededException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

  • ConcurrentModificationException

  • ResourceNotReadyException

UpdateTable 작업(Python: update_table)

데이터 카탈로그에서 메타데이터 테이블을 업데이트합니다.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 있는 데이터 데이터베이스의 이름입니다. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • TableInput필수(Required): TableInput 객체입니다.

    업데이트된 TableInput 객체는 카탈로그에 생성할 메타데이터 테이블을 정의합니다.

  • SkipArchive – 부울입니다.

    기본적으로 UpdateTable는 항상 업데이트하기 전에 테이블 보관 버전을 생성합니다. 그러나 skipArchive이 true이면 UpdateTable는 보관된 버전을 생성하지 않습니다.

  • TransactionIdCustom string pattern #11과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블 콘텐츠를 업데이트할 트랜잭션 ID입니다.

  • VersionIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블 콘텐츠를 업데이트할 버전 ID입니다.

응답
  • 무응답 파라미터.

오류
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • ConcurrentModificationException

  • ResourceNumberLimitExceededException

  • GlueEncryptionException

  • ResourceNotReadyException

DeleteTable 작업(Python: delete_table)

데이터 카탈로그에서 테이블 정의를 제거합니다.

참고

이 작업을 완료하면 삭제된 테이블에 속한 테이블 버전 및 파티션에 더 이상 액세스할 수 없습니다. AWS Glue는 이러한 "분리된" 리소스를 서비스 재량에 따라 적시에 비동기로 삭제합니다.

관련된 모든 리소스가 즉시 삭제되도록 DeleteTable 호출 전에 DeleteTableVersion 또는 BatchDeleteTableVersionDeletePartition 또는 BatchDeletePartition을 사용하여 테이블에 속한 모든 리소스를 삭제하십시오.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 있는 데이터 데이터베이스의 이름입니다. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • Name필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    삭제된 테이블 이름. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • TransactionIdCustom string pattern #11과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블 콘텐츠를 삭제할 트랜잭션 ID입니다.

응답
  • 무응답 파라미터.

오류
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • ConcurrentModificationException

  • ResourceNotReadyException

BatchDeleteTable 작업(Python: batch_delete_table)

한 번에 여러 테이블 삭제

참고

이 작업을 완료하면 삭제된 테이블에 속한 테이블 버전 및 파티션에 더 이상 액세스할 수 없습니다. AWS Glue는 이러한 "분리된" 리소스를 서비스 재량에 따라 적시에 비동기로 삭제합니다.

관련된 모든 리소스가 즉시 삭제되도록 BatchDeleteTable 호출 전에 DeleteTableVersion 또는 BatchDeleteTableVersionDeletePartition 또는 BatchDeletePartition을 사용하여 테이블에 속한 모든 리소스를 삭제하십시오.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    삭제할 테이블이 있는 카탈로그 데이터베이스의 이름입니다. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • TablesToDelete필수(Required): 100개 이하의 문자열로 구성된 UTF-8 문자열입니다.

    삭제할 테이블 목록.

  • TransactionIdCustom string pattern #11과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블 콘텐츠를 삭제할 트랜잭션 ID입니다.

응답
  • ErrorsTableError 객체의 배열입니다.

    지정된 테이블을 삭제하는 중 발생한 오류 목록입니다.

오류
  • InvalidInputException

  • EntityNotFoundException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

  • ResourceNotReadyException

GetTable 작업(Python: get_table)

지정된 테이블의 데이터 카탈로그에서 Table정의를 가져옵니다.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 있는 카탈로그의 데이터베이스 이름입니다. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • Name필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    정의를 가져오는 테이블의 이름입니다. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • TransactionIdCustom string pattern #11과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블 콘텐츠를 읽을 트랜잭션 ID입니다.

  • QueryAsOfTime – 타임스탬프입니다.

    테이블 콘텐츠를 읽을 기준 시간입니다. 설정하지 않으면 가장 최근의 트랜잭션 커밋 시간이 사용됩니다. TransactionId과(와) 함께 지정할 수 없습니다.

응답
  • Table 객체입니다.

    지정한 테이블을 정의하는 Table 객체.

오류
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

  • ResourceNotReadyException

GetTables 작업(Python: get_tables)

주어진 Database의 테이블 중 몇 개 혹은 모두의 정의를 가져옵니다.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    기록할 테이블이 있는 카탈로그의 데이터베이스입니다. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • ExpressionSingle-line string pattern과(와) 일치하는 2,048바이트 이하 길이의 UTF-8 문자열입니다.

    정규 표현식 패턴 테이블이 있으면 이름이 패턴과 일치하는 테이블만 반환됩니다.

  • NextToken – UTF-8 문자열입니다.

    이것이 지속적으로 호출되면 지속적인 토큰을 포함합니다.

  • MaxResults – 1~100의 숫자(정수)입니다.

    한 번의 응답으로 반환할 최대 테이블 수.

  • TransactionIdCustom string pattern #11과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블 콘텐츠를 읽을 트랜잭션 ID입니다.

  • QueryAsOfTime – 타임스탬프입니다.

    테이블 콘텐츠를 읽을 기준 시간입니다. 설정하지 않으면 가장 최근의 트랜잭션 커밋 시간이 사용됩니다. TransactionId과(와) 함께 지정할 수 없습니다.

응답
  • TableList 객체의 배열입니다.

    요청한 Table 객체의 목록입니다.

  • NextToken – UTF-8 문자열입니다.

    현재 목록 부분이 유지가 되지 않으면 연속 토큰이 존재합니다.

오류
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • GlueEncryptionException

GetTableVersion 작업(Python: get_table_version)

테이블의 지정된 버전을 가져옵니다.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 있는 카탈로그의 데이터베이스. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블의 이름. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • VersionIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    가져올 테이블 버전의 ID값입니다. VersionID는 정수의 문자열 표현입니다. 각 버전은 1씩 증가합니다.

응답
  • TableVersionTableVersion 객체입니다.

    요청한 테이블 버전

오류
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

GetTableVersions 작업(Python: get_table_versions)

문자열 목록을 가져와 지정된 테이블의 사용 가능한 버전을 식별합니다.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 있는 카탈로그의 데이터베이스. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블의 이름. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • NextToken – UTF-8 문자열입니다.

    이것이 첫 번째 호출이 아니면 지속적인 토큰입니다.

  • MaxResults – 1~100의 숫자(정수)입니다.

    한 번의 응답으로 반환될 최대 테이블 버전 수입니다.

응답
  • TableVersionsTableVersion 객체의 배열입니다.

    문자열 목록은 지정된 테이블의 사용 가능한 버전을 식별합니다.

  • NextToken – UTF-8 문자열입니다.

    사용 가능한 버전 목록이 마지막 버전을 포함하지 않은 경우의 연속 토큰입니다.

오류
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

DeleteTableVersion 작업(Python: delete_table_version)

테이블의 지정된 버전을 삭제합니다.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 있는 카탈로그의 데이터베이스. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블의 이름. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • VersionId필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    삭제될 테이블 버전의 ID입니다. VersionID는 정수의 문자열 표현입니다. 각 버전은 1씩 증가합니다.

응답
  • 무응답 파라미터.

오류
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

BatchDeleteTableVersion 작업(Python: batch_delete_table_version)

테이블 버전의 지정된 배치를 삭제합니다.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 존재하는 데이터 카탈로그의 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블이 있는 카탈로그의 데이터베이스. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    테이블의 이름. 이름은 모두 소문자로 되어 있어야 Hive 호환성을 유지합니다.

  • VersionIds필수(Required): 100개 이하의 문자열로 구성된 UTF-8 문자열입니다.

    삭제될 ID 버전 목록입니다. VersionId는 정수의 문자열 표현입니다. 각 버전은 1씩 증가합니다.

응답
  • ErrorsTableVersionError 객체의 배열입니다.

    지정된 테이블 버전을 삭제하고자 할 때 발생한 오류 목록입니다.

오류
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

SearchTables 작업(Python: search_tables)

상위 데이터베이스 뿐만 아니라 테이블 메타데이터의 속성을 기반으로 테이블 집합을 검색합니다. 텍스트 또는 필터 조건으로 검색할 수 있습니다.

Lake Formation에 정의된 보안 정책을 기반으로 액세스할 수 있는 테이블만 가져올 수 있습니다. 테이블이 반환되기 위해서는 최소한 읽기 전용 액세스 권한이 필요합니다. 테이블의 모든 열에 액세스할 수 없으면, 테이블 목록이 다시 반환될 때 이러한 열이 검색되지 않습니다. 열에 액세스할 수 있지만 열의 데이터에는 액세스할 수 없는 경우 해당 열 및 해당 열의 관련 메타데이터가 검색에 포함됩니다.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    account_id로 구성된 고유한 식별자입니다.

  • NextToken – UTF-8 문자열입니다.

    이것이 지속적으로 호출되면 지속적인 토큰을 포함합니다.

  • FiltersPropertyPredicate 객체의 배열입니다.

    키-값 페어의 목록 및 검색 결과를 필터링하는 데 사용되는 비교기입니다. 조건자와 일치하는 모든 엔터티를 반환합니다.

    PropertyPredicate 구조체의 Comparator 멤버는 시간 필드에만 사용되며 다른 필드 유형에서는 생략할 수 있습니다. 또한 Key=Name과 같이 문자열 값을 비교할 때 퍼지 일치 알고리즘을 사용합니다. Key 필드(예: Name 필드 값)는 특정 구두점 문자(예: -, :, # 등)에서 토큰으로 분할됩니다. 그런 다음 각 토큰은 PropertyPredicateValue 멤버와 정확히 일치합니다. 예를 들어 Key=NameValue=link가 있으면 customer-linkxx-link-yy라는 테이블은 반환되지만 xxlinkyy는 반환되지 않는다.

  • SearchText – 1,024바이트 이하 길이의 값 문자열입니다.

    텍스트 검색에 사용되는 문자열입니다.

    인용 부호로 값을 지정하면, 정확도를 기준으로 필터링합니다.

  • SortCriteriaSortCriterion 객체의 배열이며 구조는 1개 이하입니다.

    필드 이름을 기준으로 결과를 오름차순 또는 내림차순으로 정렬하는 기준 목록입니다.

  • MaxResults – 1~1,000의 숫자(정수)입니다.

    한 번의 응답으로 반환할 최대 테이블 수.

  • ResourceShareType – UTF-8 문자열입니다(유효 값: FOREIGN | ALL).

    계정과 공유된 테이블을 검색하도록 지정할 수 있습니다. 허용 가능 값은 FOREIGN 또는 ALL입니다.

    • FOREIGN으로 설정하면 계정과 공유된 테이블이 검색됩니다.

    • ALL로 설정하면 계정과 공유된 테이블과 로컬 계정의 테이블이 검색됩니다.

응답
  • NextToken – UTF-8 문자열입니다.

    현재 목록 부분이 유지가 되지 않으면 연속 토큰이 존재합니다.

  • TableList 객체의 배열입니다.

    요청한 Table 객체의 목록입니다. SearchTables 응답은 액세스할 수 있는 테이블만 반환합니다.

오류
  • InternalServiceException

  • InvalidInputException

  • OperationTimeoutException

GetPartitionIndexes 작업(Python: get_partition_indexes)

테이블과 연결된 파티션 인덱스를 검색합니다.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 있는 카탈로그 ID입니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    파티션 인덱스를 검색하려는 데이터베이스의 이름을 지정합니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    파티션 인덱스를 검색할 테이블의 이름을 지정합니다.

  • NextToken – UTF-8 문자열입니다.

    이것이 지속적으로 호출되면 지속적인 토큰을 포함합니다.

응답
  • PartitionIndexDescriptorListPartitionIndexDescriptor 객체의 배열입니다.

    인덱스 설명자의 목록입니다.

  • NextToken – UTF-8 문자열입니다.

    현재 목록 부분이 유지가 되지 않으면 연속 토큰이 존재합니다.

오류
  • InternalServiceException

  • OperationTimeoutException

  • InvalidInputException

  • EntityNotFoundException

  • ConflictException

CreatePartitionIndex 작업(Python: create_partition_index)

기존 테이블에 지정된 파티션 인덱스를 생성합니다.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 있는 카탈로그 ID입니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    파티션 인덱스를 생성하려는 데이터베이스의 이름을 지정합니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    파티션 인덱스를 생성하려는 테이블의 이름을 지정합니다.

  • PartitionIndex필수(Required): PartitionIndex 객체입니다.

    PartitionIndex 구조를 지정하여 기존 테이블에 파티션 인덱스를 생성합니다.

응답
  • 무응답 파라미터.

오류
  • AlreadyExistsException

  • InvalidInputException

  • EntityNotFoundException

  • ResourceNumberLimitExceededException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

DeletePartitionIndex 작업(Python: delete_partition_index)

기존 테이블에서 지정된 파티션 인덱스를 삭제합니다.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    테이블이 있는 카탈로그 ID입니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    파티션 인덱스를 삭제하려는 데이터베이스의 이름을 지정합니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    파티션 인덱스를 삭제하려는 테이블의 이름을 지정합니다.

  • IndexName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    삭제할 파티션 인덱스의 이름입니다.

응답
  • 무응답 파라미터.

오류
  • InternalServiceException

  • OperationTimeoutException

  • InvalidInputException

  • EntityNotFoundException

  • ConflictException

  • GlueEncryptionException

GetColumnStatisticsForTable 작업(Python: get_column_statistics_for_table)

열의 테이블 통계를 검색합니다.

이 작업에 필요한 Identity and Access Management(IAM) 권한은 GetTable입니다.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    문제의 파티션이 존재하는 데이터 카탈로그 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    파티션이 있는 카탈로그 데이터베이스 이름입니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    파티션 테이블의 이름입니다.

  • ColumnNames필수(Required): 100개 이하의 문자열로 구성된 UTF-8 문자열입니다.

    열 이름의 목록입니다.

응답
  • ColumnStatisticsListColumnStatistics 객체의 배열입니다.

    검색에 실패한 ColumnStatistics 목록입니다.

  • ErrorsColumnError 객체의 배열입니다.

    검색에 실패한 ColumnStatistics 목록입니다.

오류
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

UpdateColumnStatisticsForTable 작업(Python: update_column_statistics_for_table)

열의 테이블 통계를 생성하거나 업데이트합니다.

이 작업에 필요한 Identity and Access Management(IAM) 권한은 UpdateTable입니다.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    문제의 파티션이 존재하는 데이터 카탈로그 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    파티션이 있는 카탈로그 데이터베이스 이름입니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    파티션 테이블의 이름입니다.

  • ColumnStatisticsList필수(Required): ColumnStatistics 객체의 배열이며 구조는 25개 이하입니다.

    열 통계의 목록입니다.

응답
오류
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException

DeleteColumnStatisticsForTable 작업(Python: delete_column_statistics_for_table)

열의 테이블 통계를 검색합니다.

이 작업에 필요한 Identity and Access Management(IAM) 권한은 DeleteTable입니다.

요청
  • CatalogIdSingle-line string pattern과(와) 일치하는 1~255바이트 길이의 카탈로그 ID 문자열입니다.

    문제의 파티션이 존재하는 데이터 카탈로그 ID. 제공되지 않은 경우 기본적으로 AWS 계정 ID가 사용됩니다.

  • DatabaseName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    파티션이 있는 카탈로그 데이터베이스 이름입니다.

  • TableName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    파티션 테이블의 이름입니다.

  • ColumnName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    열의 이름입니다.

응답
  • 무응답 파라미터.

오류
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • GlueEncryptionException