AWS Glue Studio에서 Apache Iceberg 프레임워크 사용 - AWS Glue

AWS Glue Studio에서 Apache Iceberg 프레임워크 사용

데이터 대상에서 Apache Iceberg 프레임워크 사용

데이터 카탈로그 데이터 대상에서 Apache Iceberg 프레임워크 사용

  1. 대상 메뉴에서 AWS Glue Studio 데이터 카탈로그를 선택합니다.

  2. 데이터 소스 속성 탭에서 데이터베이스와 테이블을 선택합니다.

  3. AWS Glue Studio는 형식 유형을 Apache Iceberg 및 Amazon S3 URL로 표시합니다.

Amazon S3 데이터 대상에서 Apache Iceberg 프레임워크 사용

값을 입력하거나 사용 가능한 옵션 중에서 선택하여 Apache Iceberg 형식을 구성합니다.

  • 형식 - 드롭다운 메뉴에서 Apache Iceberg를 선택합니다.

  • Amazon S3 대상 위치 - S3 찾아보기를 클릭하여 Amazon S3 대상 위치를 선택합니다.

  • 데이터 카탈로그 업데이트 옵션 - 계속 진행하려면 데이터 카탈로그에 테이블 생성, 후속 실행 시 기존 스키마 유지 및 새 파티션 추가를 선택해야 합니다. AWS Glue를 사용하여 새 Iceberg 테이블을 작성하려면 Data Catalog를 Iceberg 테이블의 카탈로그로 구성해야 합니다. Data Catalog에 등록된 기존 Iceberg 테이블을 업데이트하려면 Data Catalog를 대상으로 선택합니다.

    • 데이터베이스 - Data Catalog에서 데이터베이스를 선택합니다.

    • 테이블 이름 – 사용자의 테이블 이름에 대한 값을 입력합니다. Apache Iceberg 테이블 이름은 모두 소문자여야 합니다. 공백은 허용되지 않으므로 필요한 경우 밑줄을 사용합니다. 예를 들어 'data_lake_format_tables'와 같습니다.

스크린샷에는 Amazon S3 데이터 대상에서 Apache Iceberg 프레임워크를 사용할 때 데이터 대상 속성이 나와 있습니다.

Amazon S3 데이터 소스에서 Apache Iceberg 프레임워크 사용

데이터 카탈로그 데이터 소스에서 Apache Iceberg 프레임워크 사용

  1. 소스 메뉴에서 AWS Glue Studio 데이터 카탈로그를 선택합니다.

  2. 데이터 소스 속성 탭에서 데이터베이스와 테이블을 선택합니다.

  3. AWS Glue Studio는 형식 유형을 Apache Iceberg 및 Amazon S3 URL로 표시합니다.

스크린샷에는 데이터 카탈로그 데이터 소스에서 Apache Iceberg 프레임워크를 사용할 때 데이터 대상 속성이 나와 있습니다.

Amazon S3 데이터 소스에서 Apache Iceberg 프레임워크 사용

Apache Iceberg는 AWS Glue Studio에서 Amazon S3 소스 노드의 데이터 옵션으로 사용할 수 없습니다.