PySpark で AWS Glue ETL スクリプトをプログラムする - AWS Glue

PySpark で AWS Glue ETL スクリプトをプログラムする

Python のコード例や AWS Glue のユーティリティは、GitHub サイトの AWS Glue サンプルリポジトリで公開されています。

AWS Glue での Python の使用

AWS Glue では、抽出、変換、ロード (ETL) ジョブをスクリプト化するための PySpark Python 拡張言語機能がサポートされています。このセクションでは、ETL スクリプトと AWS Glue API で Python を使用する方法について説明します。

AWS Glue PySpark 拡張機能

AWS Glue は PySpark Python 方言に以下の拡張機能を作成しました。

AWS Glue PySpark 変換

AWS Glue は PySpark ETL オペレーションで使用する次の変換クラスを作成しました。