翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
でクラスターを作成する JupyterHub
Amazon EMR クラスターはAWS Management Console、AWS Command Line Interface、または Amazon EMR API JupyterHub を使用して作成できます。ステップ完了後に自動終了するオプションでクラスターを作成していないことを確認します (AWS CLI の --auto-terminate
オプション)。また、管理者とノートブックユーザーがクラスターの作成時に使用するキーペアにアクセスできることを確認します。詳細は、「Amazon EMR 管理ガイド」の「SSH 認証情報にキーペアを使用する」を参照してください。
JupyterHub コンソールを使用してクラスターを作成する
以下の手順に従って、Amazon EMR コンソールで [Advanced Options] (詳細オプション) を使用し、 JupyterHub インストールされるクラスターを作成します。
Amazon EMR JupyterHub コンソールを使用してインストールされた Amazon EMR クラスターを作成するには
-
Amazon EMR コンソール (https://console.aws.amazon.com/emr
) を開きます。 -
[Create cluster (クラスターの作成)]、[Go to advanced options (詳細オプションに移動する)] の順に選択します。
[Software Configuration (ソフトウェア設定)] で次を実行します。
[リリース] で、emr-5.36.0 を選択し、を選択します JupyterHub。
Spark を使用していて、AWS Glue Data Catalog を Spark SQL のメタストアとして使う場合は [Use for Spark table metadata] (Spark テーブルメタデータに使用) を選択します。詳細については、「Spark SQL のメタストアとしての AWS Glue Data Catalog の使用」を参照してください。
[Edit software settings (ソフトウェア設定の編集)] には [Enter configuration (設定の入力)] を選択し、値を指定するか [Load JSON from S3 (S3 からの JSON のロード)] を選び JSON 設定ファイルを指定します。詳細については、「構成中 JupyterHub」を参照してください。
クラスターを作成した時点で [Add steps (optional) (ステップの追加 (オプション))] で実行するステップを設定する場合は、[Auto-terminate cluster after the last step is completed (最後のステップが完了したらクラスターを自動終了する)] を選択せずに、[Next (次へ)] を選びます。
[Hardware Configuration (ハードウェア構成)] オプション、[Next (次へ)] の順に選択します。詳細については、「Amazon EMR 管理ガイド」の「クラスターハードウェアとネットワークを構成する」を参照してください。
[General Cluster Settings (クラスターの全般設定)] オプションを選択し [Next (次へ)] を選びます。
[Security Options (セキュリティオプション)] でキーペアを指定し、[Create Cluster (クラスターの作成)] を選択します。
JupyterHub を使用してクラスターを作成しますAWS CLI
でクラスターを起動するには JupyterHub、aws emr create-cluster
コマンドを使用し、--applications
オプションにはを指定しますName=JupyterHub
。次の例は Amazon EMR JupyterHub で 2 つの EC2 インスタンス (マスターインスタンスとコアインスタンス) を使用する デバッグも有効になっています。--log-uri
が指定する Amazon S3 ロケーションにログが保存されています。指定されたキーペアはクラスター内の Amazon EC2 インスタンスへのアクセスを提供します。
読みやすくするために、Linux 行連続文字 (\) が含まれています。Linux コマンドでは、これらは削除することも、使用することもできます。Windows の場合、削除するか、キャレット (^) に置き換えてください。
aws emr create-cluster --name="
MyJupyterHubCluster
" --release-label emr-5.36.0 \ --applications Name=JupyterHub --log-uris3://MyBucket/MyJupyterClusterLogs
\ --use-default-roles --instance-type m5.xlarge --instance-count2
--ec2-attributes KeyName=MyKeyPair