を使用してクラスターを作成する JupyterHub - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

を使用してクラスターを作成する JupyterHub

、 AWS Management Console AWS Command Line Interface、または Amazon JupyterHub を使用して Amazon EMR EMRクラスターを作成できますAPI。ステップ完了後に自動終了するオプションでクラスターを作成していないことを確認します ( AWS CLIの --auto-terminate オプション)。また、管理者とノートブックユーザーがクラスターの作成時に使用するキーペアにアクセスできることを確認します。詳細については、「Amazon 管理ガイド」のSSH「認証情報にキーペアを使用する」を参照してください。 EMR

コンソール JupyterHub を使用して でクラスターを作成する

Amazon EMRコンソールでアドバンストオプションを使用して JupyterHub がインストールされているクラスターを作成するには、次の手順に従います。

Amazon EMRコンソールを使用して JupyterHub がインストールされている Amazon EMRクラスターを作成するには
  1. 新しい Amazon EMRコンソールに移動し、サイドナビゲーションから古いコンソールに切り替えるを選択します。古いコンソールに切り替えたときの動作の詳細については、「Using the old console」を参照してください。

  2. [Create cluster (クラスターの作成)]、[Go to advanced options (詳細オプションに移動する)] の順に選択します。

  3. [Software Configuration (ソフトウェア設定)] で次を実行します。

    • リリース では、emr-5.36.2 を選択し、 を選択します JupyterHub。

    • Spark を使用する場合は、 AWS Glue Data Catalog を Spark のメタストアとして使用するにはSQL、「Use for Spark table metadata 」を選択します。詳細については、「Spark のメタストアとして AWS Glue データカタログを使用する SQL」を参照してください。

    • ソフトウェア設定を編集するには、設定を入力して値を指定するか、S3 JSONからロードを選択してJSON設定ファイルを指定します。詳細については、「の設定 JupyterHub」を参照してください。

  4. クラスターを作成した時点で [Add steps (optional) (ステップの追加 (オプション))] で実行するステップを設定する場合は、[Auto-terminate cluster after the last step is completed (最後のステップが完了したらクラスターを自動終了する)] を選択せずに、[Next (次へ)] を選びます。

  5. [Hardware Configuration (ハードウェア構成)] オプション、[Next (次へ)] の順に選択します。詳細については、「Amazon 管理ガイド」の「クラスターハードウェアとネットワークの設定」を参照してください。 EMR

  6. [General Cluster Settings (クラスターの全般設定)] オプションを選択し [Next (次へ)] を選びます。

  7. [Security Options (セキュリティオプション)] でキーペアを指定し、[Create Cluster (クラスターの作成)] を選択します。

JupyterHub を使用して でクラスターを作成する AWS CLI

でクラスターを起動するには JupyterHub、 aws emr create-cluster コマンドを使用し、 --applicationsオプションで を指定しますName=JupyterHub。次の例では、 JupyterHub2 つのEC2インスタンス (1 つのマスターインスタンスと 1 つのコアインスタンス) EMRを持つクラスターを Amazon で起動します。デバッグも有効になっています。--log-uri が指定する Amazon S3 ロケーションにログが保存されています。指定されたキーペアは、クラスター内の Amazon EC2インスタンスへのアクセスを提供します。

注記

読みやすくするために、Linux 行連続文字 (\) が含まれています。Linux コマンドでは、これらは削除することも、使用することもできます。Windows の場合、削除するか、キャレット (^) に置き換えてください。

aws emr create-cluster --name="MyJupyterHubCluster" --release-label emr-5.36.2 \ --applications Name=JupyterHub --log-uri s3://amzn-s3-demo-bucket/MyJupyterClusterLogs \ --use-default-roles --instance-type m5.xlarge --instance-count 2 --ec2-attributes KeyName=MyKeyPair