Spark용 AWS Glue의 성능을 개선하려면 특정 성능 관련 AWS Glue 및 Spark 파라미터를 업데이트하는 것을 고려할 수 있습니다.
지표를 통해 병목 현상을 식별하고 그 영향을 줄이기 위한 구체적인 전략에 대한 자세한 내용은 AWS 권장 가이드의 Apache Spark용 AWS Glue 작업 성능 조정 모범 사례를 참조하세요. 이 가이드에서는 Spark 아키텍처, 탄력적 분산 데이터 세트 등 모든 런타임 환경에서 Apache Spark에 적용할 수 있는 주요 주제를 소개합니다. 설명서에서는 이러한 주제를 사용하여 셔플 최적화 및 작업 병렬화와 같은 특정 성능 튜닝 전략을 구현하도록 안내합니다.
Spark UI를 표시하도록 AWS Glue를 구성하여 병목 현상을 식별할 수 있습니다. 자세한 내용은 Apache Spark 웹 UI를 사용하여 작업 모니터링 단원을 참조하십시오.
또한 AWS Glue는 작업이 연결되는 특정 유형의 데이터 스토어에 적용할 수 있는 성능 특성을 제공합니다. 데이터 스토어의 성능 파라미터에 대한 참조 정보는 AWS Glue for Spark에서 ETL에 대한 연결 유형 및 옵션에서 찾을 수 있습니다.