EMR Notebooks - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

EMR Notebooks

Amazon EMR Notebooks を Apache Spark を実行する Amazon EMR クラスターと共に使用し、Amazon EMR コンソール内で Jupter Notebook および JupyterLab のインターフェイスを作成して開くことができます。EMR Notebooks は、クエリとコードを実行するために使用できる「サーバーレス」のノートブックです。従来のノートブックとは異なり、EMR notebooks 自体の内容 (ノートブックセル内の方程式、クエリ、モデル、コード、説明テキスト) はクライアントで実行されます。コマンドは EMR クラスター上のカーネルを使用して実行されます。ノートブックの内容は、耐久性と柔軟な再利用のために、クラスターのデータとは別に Amazon S3 にも保存されます。

クラスターを起動して EMR notebooks を分析のためにアタッチしたら、クラスターを終了することができます。また、実行中のクラスターにアタッチされているノートブックを閉じて、別のものに切り替えることもできます。複数のユーザーがノートブックを同じクラスターに同時にアタッチして、Amazon S3 でノートブックファイルを互いに共有することができます。これらの機能を使用すると、クラスターをオンデマンドで実行してコストを削減し、別のクラスターやデータセットにノートブックを再設定する時間を節約できます。

また、EMR コンソールを使用することなく、EMR API を使用してプログラムで EMR notebooks を実行することもできます (「ヘッドレス実行」)。EMR notebooks に、parameters タグを持つセルを含める必要があります。このセルにより、スクリプトで新しい入力値をノートブックに渡すことが可能になります。パラメータ化されたノートブックは、異なる入力値セットで再利用できます。新しい入力値で編集して実行するために、同じノートブックのコピーを作成する必要はありません。EMR は、パラメータ化されたノートブックの実行ごとに、S3 に出力ノートブックを作成して保存します。EMR notebooks の API コードの例については、「EMR Notebooks をプログラムで実行するサンプルコマンド」を参照してください。

重要

EMR Notebooks は、Amazon EMR 5.18.0 以降を使用して作成されたクラスターでサポートされています。EMR notebooks は、Amazon EMR の最新バージョン、特に Amazon EMR リリースバージョン 5.30.0、5.32.0 以降、または 6.2.0 以降を使用して作成されたクラスターで使用することを強くお勧めします。これらのバージョンでは、Jupyter カーネルが Jupyter インスタンスではなくアタッチされたクラスターで実行されるように変更が行われています。この変更により、パフォーマンスが向上し、カーネルとライブラリのカスタマイズ機能が強化されています。詳細については、「クラスターのリリースバージョンによる機能の違い」を参照してください。

Amazon S3 ストレージの対象料金と Amazon EMR クラスターの対象料金が適用されます。