でクラスターを作成する JupyterHub - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

でクラスターを作成する JupyterHub

Amazon EMR クラスターはAWS Management Console、AWS Command Line Interface、または Amazon EMR API JupyterHub を使用して作成できます。ステップ完了後に自動終了するオプションでクラスターを作成していないことを確認します (AWS CLI の --auto-terminate オプション)。また、管理者とノートブックユーザーがクラスターの作成時に使用するキーペアにアクセスできることを確認します。詳細は、「Amazon EMR 管理ガイド」の「SSH 認証情報にキーペアを使用する」を参照してください。

JupyterHub コンソールを使用してクラスターを作成する

以下の手順に従って、Amazon EMR コンソールで [Advanced Options] (詳細オプション) を使用し、 JupyterHub インストールされるクラスターを作成します。

Amazon EMR JupyterHub コンソールを使用してインストールされた Amazon EMR クラスターを作成するには
  1. Amazon EMR コンソール (https://console.aws.amazon.com/emr) を開きます。

  2. [Create cluster (クラスターの作成)]、[Go to advanced options (詳細オプションに移動する)] の順に選択します。

  3. [Software Configuration (ソフトウェア設定)] で次を実行します。

    • [リリース] で、emr-5.36.0 を選択し、を選択します JupyterHub。

    • Spark を使用していて、AWS Glue Data Catalog を Spark SQL のメタストアとして使う場合は [Use for Spark table metadata] (Spark テーブルメタデータに使用) を選択します。詳細については、「Spark SQL のメタストアとしての AWS Glue Data Catalog の使用」を参照してください。

    • [Edit software settings (ソフトウェア設定の編集)] には [Enter configuration (設定の入力)] を選択し、値を指定するか [Load JSON from S3 (S3 からの JSON のロード)] を選び JSON 設定ファイルを指定します。詳細については、「構成中 JupyterHub」を参照してください。

  4. クラスターを作成した時点で [Add steps (optional) (ステップの追加 (オプション))] で実行するステップを設定する場合は、[Auto-terminate cluster after the last step is completed (最後のステップが完了したらクラスターを自動終了する)] を選択せずに、[Next (次へ)] を選びます。

  5. [Hardware Configuration (ハードウェア構成)] オプション、[Next (次へ)] の順に選択します。詳細については、「Amazon EMR 管理ガイド」の「クラスターハードウェアとネットワークを構成する」を参照してください。

  6. [General Cluster Settings (クラスターの全般設定)] オプションを選択し [Next (次へ)] を選びます。

  7. [Security Options (セキュリティオプション)] でキーペアを指定し、[Create Cluster (クラスターの作成)] を選択します。

JupyterHub を使用してクラスターを作成しますAWS CLI

でクラスターを起動するには JupyterHub、aws emr create-clusterコマンドを使用し、--applicationsオプションにはを指定しますName=JupyterHub。次の例は Amazon EMR JupyterHub で 2 つの EC2 インスタンス (マスターインスタンスとコアインスタンス) を使用する デバッグも有効になっています。--log-uri が指定する Amazon S3 ロケーションにログが保存されています。指定されたキーペアはクラスター内の Amazon EC2 インスタンスへのアクセスを提供します。

注記

読みやすくするために、Linux 行連続文字 (\) が含まれています。Linux コマンドでは、これらは削除することも、使用することもできます。Windows の場合、削除するか、キャレット (^) に置き換えてください。

aws emr create-cluster --name="MyJupyterHubCluster" --release-label emr-5.36.0 \ --applications Name=JupyterHub --log-uri s3://MyBucket/MyJupyterClusterLogs \ --use-default-roles --instance-type m5.xlarge --instance-count 2 --ec2-attributes KeyName=MyKeyPair