翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
SageMaker Spark for Python (PySpark) の例
Amazon SageMaker は、Apache Spark アプリケーションをSageMaker PySpark
ダウンロード PySpark
Python Spark (PySpark) ライブラリと Scala ライブラリの両方のソースコードを SageMaker Spark
SageMaker Spark ライブラリのインストール手順については、以下のオプションを使用するか、SageMaker PySpark
-
pip を使用して をインストールします。
pip install sagemaker_pyspark
-
ソースから をインストールします。
git clone git@github.com:aws/sagemaker-spark.git cd sagemaker-pyspark-sdk python setup.py install
-
Sparkmagic (PySpark)
または カーネルのいずれかを使用してリモート Amazon EMRSparkmagic (PySpark3)
クラスターに接続するノートブックインスタンスに新しいノートブックを作成することもできます。注記
Amazon EMR クラスターは、
AmazonSageMakerFullAccess
ポリシーがアタッチされた IAM ロールで設定する必要があります。EMR クラスターのロールの設定については、Amazon EMR 管理ガイドの「AWS サービスに Amazon EMR の許可の IAM ロールを設定する」を参照してください。
PySpark 例
の使用例については SageMaker PySpark、以下を参照してください。
-
「ドキュメントを読み取る」で Amazon を Apache Spark SageMaker で使用する
。 -
SageMaker Spark
GitHub リポジトリ。
ノートブックをノートブックインスタンスで実行する場合は、「サンプルノートブック」を参照してください。Studio でノートブックを実行する場合は、「Amazon SageMaker Studio Classic ノートブックを作成または開く」を参照してください。