AWS Glue 버전
AWS Glue 버전 파라미터는 작업을 추가하거나 업데이트할 때 설정합니다. AWS Glue 버전은 AWS Glue에서 지원하는 Apache Spark 및 Python의 버전을 결정합니다. Python의 버전으로 Spark 유형의 작업에 대해 지원되는 버전을 확인할 수 있습니다. 다음 테이블에는 이용 가능한 AWS Glue 버전과 그에 상응하는 Spark 및 Python 버전, 그리고 다른 기능 변경 사항이 나열됩니다.
AWS Glue 버전
AWS Glue 버전 | 지원되는 Spark 및 Python 버전 | 기능 변경 사항 |
---|---|---|
0.9 |
|
AWS Glue 버전 지정 없이 생성된 작업은 AWS Glue 0.9로 기본 지정됩니다. |
AWS Glue 1.0 |
|
AWS Glue ETL 작업에서는 Parquet 및 ORC 포맷에 대해 작업 북마크를 유지할 수 있습니다(AWS Glue 버전 1.0 사용). 이전에는 AWS Glue ETL 작업에서 JSON, CSV, Apache Avro, XML처럼 일반적인 Amazon S3 원본 포맷만 북마크가 가능했습니다. ETL 입력 및 출력의 포맷 옵션을 설정할 때 Apache Avro 리더/라이터 포맷 1.8을 사용해 Avro 논리적 유형 읽기 및 쓰기를 지원하도록 지정할 수 있습니다(AWS Glue 버전 1.0 사용). 이전에는 버전 1.7 Avro 리더/라이터 포맷만 지원되었습니다. DynamoDB 연결 유형은 라이터 옵션(AWS Glue 버전 1.0 사용)을 지원합니다. |
AWS Glue 2.0 |
|
AWS Glue 버전 1.0에서 제공되는 기능 외에도 AWS Glue 버전 2.0은 다음을 제공합니다.
AWS Glue 버전 2.0은 기본 아키텍처 변경으로 인해 일부 종속성 및 버전에 대해 AWS Glue 버전 1.0과 다릅니다. 주요 AWS Glue 버전 릴리스 간에 마이그레이션하기 전에 Glue 작업을 검증합니다. AWS Glue 버전 2.0의 기능 및 제한 사항에 대한 자세한 내용은 단축된 시작 시간으로 Spark ETL 작업 실행 섹션을 참조하세요. |
3.0 |
|
AWS Glue 3.0은 AWS Glue의 새 버전입니다. Spark 엔진을 3.0으로 업그레이드하는 것 외에도 이 AWS Glue 릴리스에는 다음과 같은 최적화 및 업그레이드가 내장되어 있습니다.
제한 사항다음은 AWS Glue 3.0의 제한 사항입니다.
AWS Glue 버전 3.0으로 마이그레이션에 대한 자세한 내용은 AWS Glue 버전 3.0으로 AWS Glue 작업 마이그레이션AWS Glue 3.0으로 마이그레이션할 작업 섹션을 참조하세요. |