JupyterHub の設定 - Amazon EMR

JupyterHub の設定

また、クラスターマスターノードに接続し設定ファイルを編集することで、Amazon EMR の JupyterHub や各ユーザーノートブックの設定をカスタマイズすることができます。値を変更したら jupyterhub コンテナを再起動します。

次のファイルのプロパティを変更して、JupyterHub と各 Jupyter Notebook を設定します。

  • jupyterhub_config.py - デフォルトでは、このファイルはマスターノードの /etc/jupyter/conf/ ディレクトリに保存されています。詳細については、JupyterHub ドキュメントの「Configuration Basics」を参照してください。

  • jupyter_notebook_config.py - このファイルは、デフォルトで /etc/jupyter/ ディレクトリに保存され、デフォルトとして jupyterhub コンテナにコピーされます。詳細については、Jupyter Notebook のドキュメントで「Config file and command line options」を参照してください。

jupyter-sparkmagic-conf 設定分類を使用して Sparkmagic をカスタマイズすることもできます。これにより Sparkmagic の config.json ファイルの値が更新されます。使用可能な設定の詳細については GitHub の「example_config.json」を参照してください。Amazon EMR のアプリケーションで設定分類を使用する方法について詳しくは「アプリケーションの設定」を参照してください。

次の例では、Sparkmagic 設定分類の MyJupyterConfig.json ファイルを参照する AWS CLI を使用してクラスターを起動します。

注記

読みやすくするために、Linux 行連続文字 (\) が含まれています。Linux コマンドでは、これらは削除することも、使用することもできます。Windows の場合、削除するか、キャレット (^) に置き換えてください。

aws emr create-cluster --use-default-roles --release-label emr-5.14.0 \ --applications Name=Jupyter --instance-type m4.xlarge --instance-count 3 \ --ec2-attributes KeyName=MyKey,SubnetId=subnet-1234a5b6 --configurations file://MyJupyterConfig.json

MyJupyterConfig.json のサンプルコンテンツは次のようになります。

[ { "Classification":"jupyter-sparkmagic-conf", "Properties": { "kernel_python_credentials" : "{\"username\":\"diego\",\"base64_password\":\"mypass\",\"url\":\"http:\/\/localhost:8998\",\"auth\":\"None\"}" } } ]
注記

Amazon EMR バージョン 5.21.0 以降では、実行中のクラスター内のインスタンスグループごとに、クラスター設定を上書きして追加の設定分類を指定できます。これを行うには、Amazon EMR コンソール、AWS Command Line Interface (AWS CLI)、または AWS SDK を使用します。詳細については、「実行中のクラスター内のインスタンスグループの設定を指定する」を参照してください。