Amazon EMR ノートブックの使用 - Amazon EMR

Amazon EMR ノートブックの使用

Amazon EMR ノートブック を Apache Spark を実行する Amazon EMR クラスターと一緒に使用して、Amazon EMR コンソールで Jupyter Notebook と JupyterLab のインターフェイスを作成して開くことができます。EMR ノートブック は、クエリとコードを実行するために使用できる「サーバーレス」のノートブックです。従来のノートブックとは異なり、EMR ノートブック 自体の内容 (ノートブックのセルの式、クエリ、モデル、コード、説明のテキスト) はクライアントで実行されます。コマンドは EMR クラスター上のカーネルを使用して実行されます。ノートブックの内容は、耐久性と柔軟な再利用のために、クラスターのデータとは別に Amazon S3 にも保存されます。

クラスターを起動して EMR ノートブック を分析のためにをアタッチしたら、クラスターを終了することができます。また、実行中のクラスターにアタッチされているノートブックを閉じて、別のものに切り替えることもできます。複数のユーザーがノートブックを同じクラスターに同時にアタッチすると、Amazon S3 でノートブックファイルを互いに共有することができます。これらの機能を使用すると、クラスターをオンデマンドで実行してコストを削減し、別のクラスターやデータセットにノートブックを再設定する時間を節約できます。

重要

EMR ノートブック は、Amazon EMR 5.18.0 以降を使用して作成されたクラスターでサポートされています。EMR ノートブック は、最新バージョンの Amazon EMR (具体的には、Amazon EMR リリースバージョン 5.30.0 以降。6.0.0 は除く) を使用して作成されたクラスターで使用することを強くお勧めします。Amazon EMR 5.30.0 では、Jupyter カーネルが Jupyter インスタンスではなく、アタッチされたクラスターで実行されるようになっています。この変更により、パフォーマンスが向上し、カーネルとライブラリのカスタマイズ機能が強化されています。詳細については、「クラスターのリリースバージョンによる機能の違い」を参照してください。

Amazon S3 ストレージの対象料金と Amazon EMR クラスターの対象料金が適用されます。