Amazon EMR
Amazon EMR リリースガイド

JupyterHub の設定

また、クラスターマスターノードに接続し設定ファイルを編集することで、Amazon EMR の JupyterHub や各ユーザーノートブックの設定をカスタマイズすることができます。値を変更したら jupyterhub コンテナを再起動します。

次のファイルの Modify プロパティで JupyterHub と各 Jupyter ノートブックを設定します。

  • jupyterhub_config.py—デフォルトにより、このファイルはマスターノードの /etc/jupyter/conf/ ディレクトリに保存されています。詳細については、JupyterHub ドキュメントの「Configuration Basics」を参照してください。

  • jupyter_notebook_config.py — このファイルは、デフォルトで /etc/jupyter/ ディレクトリに保存され、デフォルトとして jupyterhub コンテナにコピーされます。詳細については、Jupyter ノートブックのドキュメントで「Config file and command line options」を参照してください。

jupyter-sparkmagic-conf 設定分類を使用して Sparkmagic をカスタマイズすることもできます。これにより Sparkmagic の config.json ファイルの値が更新されます。使用可能な設定の詳細については GitHub の「example_config.json」を参照してください。Amazon EMR のアプリケーションで設定分類を使用する方法については「アプリケーションの設定」を参照してください。

次の例では、Sparkmagic 設定分類の MyJupyterConfig.json ファイルを参照する AWS CLI を使用してクラスターを起動します。

注記

読みやすくするため、Linux の行連結文字 (\) を含めています。Linux コマンドでは、これらの文字は削除することも、使用することもできます。Windows の場合は、削除するか、キャレット (^) で置き換えます。

aws emr create-cluster --use-default-roles --release-label emr-5.14.0 \ --applications Name=Jupyter --instance-type m4.xlarge --instance-count 3 \ --ec2-attributes KeyName=MyKey,SubnetId=subnet-1234a5b6 --configurations file://MyJupyterConfig.json

MyJupyterConfig.json のサンプルコンテンツは次のようになります。

[ { "Classification":"jupyter-sparkmagic-conf", "Properties": { "kernel_python_credentials" : "{\"username\":\"diego\",\"base64_password\":\"mypass\",\"url\":\"http:\/\/localhost:8998\",\"auth\":\"None\"}" } } ]

注記

Amazon EMR バージョン 5.21.0 以降では、実行中のクラスター内のインスタンスグループごとに、クラスタ設定を上書きして追加の設定分類を指定できます。これを行うには、Amazon EMR コンソール、AWS Command Line Interface (AWS CLI)、または AWS SDK を使用します。詳細については、「実行中のクラスター内のインスタンスグループの設定を指定する」を参照してください。