ノートブックセッションの管理
AWS Glue Studio 中のノートブックは、AWS Glue のインタラクティブセッション機能に基づいています。インタラクティブセッションの使用にはコストがかかります。コストの管理に役立つように、アカウント用に作成されたセッションをモニタリングし、すべてのセッションのデフォルト設定を構成できます。
すべてのノートブックセッションのデフォルトのタイムアウトを変更します。
デフォルトでは、プロビジョニングされた AWS Glue Studio ノートブックの起動の後に実行されたセルがない場合、そのノートブックは 12 時間後にタイムアウトします。これに関連して料金が発生することはありません。また、このタイムアウトは設定できません。
セルを実行することにより、インタラクティブなセッションが開始されます。このセッションのデフォルトのタイムアウトは 48 時間です。このタイムアウトは、セルを実行する前に %idle_timeout
マジックを渡すことで設定が可能です。
AWS Glue Studio の中のノートブックのデフォルトのセッションタイムアウトを変更するには
-
ノートブックに、セル内に
%idle_timeout
のマジックを入力し、タイムアウト値を分単位で指定します。 -
例:
%idle_timeout 15
はデフォルトのタイムアウトを 15 分に変更します。15 分以内にセッションを使用しない場合、セッションは自動的に停止します。
追加 Python モジュールのインストール
[pip] を使用してセッションに追加のモジュールをインストールする場合は、%additional_python_modules
を使用してセッションに追加します。
%additional_python_modules awswrangler, s3://mybucket/mymodule.whl
[additional_python_modules] へのすべての引数が pip3 install -m <>
に渡されます。
利用可能な Python モジュールのリストについては、「AWS Glue での Python ライブラリの使用」を参照してください。
AWS Glue の設定の変更
マジックを使ってAWS Glue ジョブの設定値を管理できます 。ジョブ設定値を変更する場合は、ノートブックで適切なマジックを使用する必要があります。「Magics supported by AWS Glue interactive sessions for Jupyter」を参照してください。
注記
実行中のセッションのプロパティを上書きできなくなりました。セッションの設定を変更する場合は、セッションを停止し、新しい構成を設定してから、新しいセッションを開始します。
AWS Glue はさまざまなワーカータイプをサポートしています。ワーカータイプは、%worker_type
を用いて設定できます。例: %worker_type G.2X
。デフォルトは G.1X です。
%number_of_workers
を使用してワーカー数を指定することもできます。例えば、40 人のワーカーを指定するには: %number_of_workers 40
。
さらなる詳細については、「Defining Job Properties」を参照してください。
ノートブックセッションを停止します。
ノートブックセッションを停止するには、マジックの %stop_session
を使用します。
AWS コンソールでノートブックから離れると、セッションの停止を選択できる警告メッセージが表示されます。