翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
を使用してクラスターを作成する JupyterHub
、 AWS Management Console AWS Command Line Interface、または Amazon JupyterHub を使用して Amazon EMR EMRクラスターを作成できますAPI。ステップ完了後に自動終了するオプションでクラスターを作成していないことを確認します ( AWS CLIの --auto-terminate
オプション)。また、管理者とノートブックユーザーがクラスターの作成時に使用するキーペアにアクセスできることを確認します。詳細については、「Amazon 管理ガイド」のSSH「認証情報にキーペアを使用する」を参照してください。 EMR
コンソール JupyterHub を使用して でクラスターを作成する
Amazon EMRコンソールでアドバンストオプションを使用して JupyterHub がインストールされているクラスターを作成するには、次の手順に従います。
Amazon EMRコンソールを使用して JupyterHub がインストールされている Amazon EMRクラスターを作成するには
新しい Amazon EMRコンソールに移動し、サイドナビゲーションから古いコンソールに切り替えるを選択します。古いコンソールに切り替えたときの動作の詳細については、「Using the old console」を参照してください。
-
[Create cluster (クラスターの作成)]、[Go to advanced options (詳細オプションに移動する)] の順に選択します。
[Software Configuration (ソフトウェア設定)] で次を実行します。
リリース では、emr-5.36.2 を選択し、 を選択します JupyterHub。
Spark を使用する場合は、 AWS Glue Data Catalog を Spark のメタストアとして使用するにはSQL、「Use for Spark table metadata 」を選択します。詳細については、「Spark のメタストアとして AWS Glue データカタログを使用する SQL」を参照してください。
ソフトウェア設定を編集するには、設定を入力して値を指定するか、S3 JSONからロードを選択してJSON設定ファイルを指定します。詳細については、「の設定 JupyterHub」を参照してください。
クラスターを作成した時点で [Add steps (optional) (ステップの追加 (オプション))] で実行するステップを設定する場合は、[Auto-terminate cluster after the last step is completed (最後のステップが完了したらクラスターを自動終了する)] を選択せずに、[Next (次へ)] を選びます。
[Hardware Configuration (ハードウェア構成)] オプション、[Next (次へ)] の順に選択します。詳細については、「Amazon 管理ガイド」の「クラスターハードウェアとネットワークの設定」を参照してください。 EMR
[General Cluster Settings (クラスターの全般設定)] オプションを選択し [Next (次へ)] を選びます。
[Security Options (セキュリティオプション)] でキーペアを指定し、[Create Cluster (クラスターの作成)] を選択します。
JupyterHub を使用して でクラスターを作成する AWS CLI
でクラスターを起動するには JupyterHub、 aws emr create-cluster
コマンドを使用し、 --applications
オプションで を指定しますName=JupyterHub
。次の例では、 JupyterHub2 つのEC2インスタンス (1 つのマスターインスタンスと 1 つのコアインスタンス) EMRを持つクラスターを Amazon で起動します。デバッグも有効になっています。--log-uri
が指定する Amazon S3 ロケーションにログが保存されています。指定されたキーペアは、クラスター内の Amazon EC2インスタンスへのアクセスを提供します。
注記
読みやすくするために、Linux 行連続文字 (\) が含まれています。Linux コマンドでは、これらは削除することも、使用することもできます。Windows の場合、削除するか、キャレット (^) に置き換えてください。
aws emr create-cluster --name="
MyJupyterHubCluster
" --release-label emr-5.36.2 \ --applications Name=JupyterHub --log-uris3://amzn-s3-demo-bucket/MyJupyterClusterLogs
\ --use-default-roles --instance-type m5.xlarge --instance-count2
--ec2-attributes KeyName=MyKeyPair