AWS Glue for Spark のパフォーマンスを向上させるには、AWS Glue 関連のパフォーマンスおよび Spark パラメータを更新することを検討してください。
メトリクスを通じてボトルネックを特定し、その影響を軽減するための具体的な戦略に関する詳細は、「AWS 規範的ガイダンス」の「Best practices for performance tuning AWS Glue for Apache Spark jobs」を参照してください。このガイドでは、Spark アーキテクチャや Resilient Distributed Datasets など、すべてのランタイム環境で Apache Spark に適用できる主なトピックを紹介します。これらのトピックを参考に、シャッフルの最適化やタスクの並列化など、特定のパフォーマンスチューニング戦略を実装する方法を案内します。
AWS Glue を設定して Spark UI を表示することにより、ボトルネックを特定できます。詳細については、「Apache Spark ウェブ UI を使用したジョブのモニタリング」を参照してください。
さらに、AWS Glue はジョブが接続する特定タイプのデータストアに適用できるパフォーマンス機能も提供します。データストアのパフォーマンスパラメータに関する参照情報は、AWS Glue for Spark での ETL の接続タイプとオプション にあります。