PySpark で AWS Glue ETL スクリプトをプログラムする - AWS Glue

PySpark で AWS Glue ETL スクリプトをプログラムする

AWS Glue 用の Python コード例とユーティリティは、GitHub ウェブサイトの AWS Glue サンプルリポジトリで見つかります。

AWS Glue での Python の使用

AWS Glue では、抽出、変換、ロード (ETL) ジョブをスクリプト化するための PySpark Python 拡張言語機能がサポートされています。このセクションでは、ETL スクリプトと AWS Glue API で Python を使用する方法について説明します。

AWS Glue PySpark 拡張機能

AWS Glue には、PySpark (Python の関連言語) 向けに、以下の拡張機能が追加されています。

AWS Glue PySpark 変換

AWS Glue には、PySpark での ETL オペレーションに使用するため、次の変換クラスが用意されています。