AWS Glue コンソールでノートブックを使用する - AWS Glue

AWS Glue コンソールでノートブックを使用する

開発エンドポイントは、AWS Glue スクリプトの開発およびテストに使用できる環境です。ノートブック を使用して、インタラクティブな開発と、開発エンドポイントにおける ETL (抽出、変換、ロード) スクリプトのテストを行うことができます。

AWS Glue には、SageMaker ノートブックおよび Apache Zeppelin ノートブックサーバーに対するインターフェイスが用意されています。AWS Glue ノートブックページで、SageMaker ノートブックを作成し、開発エンドポイントにアタッチできます。開発エンドポイントに作成してアタッチした Zeppelin ノートブックサーバーを管理することもできます。Zeppelin ノートブックサーバーを作成するには、「Amazon EC2 でホストされているノートブックサーバーの作成」を参照してください。

AWS Glue コンソールの [Notebooks] (ノートブック) ページには、AWS Glue 環境のすべての SageMaker ノートブックと Zeppelin ノートブックサーバーが一覧表示されます。コンソールを使用して、ノートブックでいくつかのアクションを実行できます。ノートブックまたはノートブックサーバーの詳細を表示するには、リスト内のノートブックを選択します。ノートブックの詳細には、[Create SageMaker notebook] または [Create Zeppelin Notebook server] ウィザードを使用して作成したときに定義した情報が含まれます。

必要に応じて、開発エンドポイントにアタッチされている SageMaker ノートブックを別の開発エンドポイントに切り替えることができます。開発エンドポイントの切り替えアクションは、2019 年 11 月 21 日より後に作成された SageMaker ノートブックでのみサポートされます。

SageMaker ノートブックを別の開発エンドポイントに切り替えるには

  1. AWS Management Console にサインインし、AWS Glue コンソール (https://console.aws.amazon.com/glue/) を開きます。

  2. ナビゲーションペインで [Notebooks] を選択します。

  3. リストからノートブックを選択します。[Action]、[Switch Dev Endpoint] の順に選択します。

  4. 使用可能な開発エンドポイントを選択し、[Apply] を選択します。

    このアクションには特定の IAM ロールが必要です。詳細については、「Amazon SageMaker ノートブック用の IAM ポリシーの作成」を参照してください。

SageMaker ノートブックは、アタッチされている開発エンドポイントに接続されているかどうかを定期的に確認します。接続されていない場合、ノートブックは自動的に再接続を試みます。

AWS Glue コンソール上の SageMaker ノートブック

SageMaker ノートブックのいくつかのプロパティを次に示します。ノートブックの詳細を表示すると、コンソールにはこれらのプロパティの一部が表示されます。

重要

AWS Glue は、特定の AWS リージョンでのみ SageMaker ノートブックを管理します。詳細については、「ノートブックの管理」を参照してください。

開始する前に、AWS Glue コンソールで SageMaker ノートブックを管理するアクセス許可があることを確認してください。詳細については、ステップ 3: AWS Glue にアクセスする IAM ユーザーにポリシーをアタッチする の「AWSGlueConsoleSageMakerNotebookFullAccess」を参照してください。

ノートブックの名前

SageMaker ノートブックの一意の名前です。

開発エンドポイント

このノートブックがアタッチされている開発エンドポイントの名前です。

重要

この開発エンドポイントは、2018 年 8 月 15 日以降に作成されている必要があります。

ステータス

ノートブックと、[Ready]、[Failed]、[Starting]、[Stopping]、[Stopped] のプロビジョニングのステータス。

失敗の理由

ステータスが [Failed] の場合、ノートブックの理由が失敗します。

インスタンスタイプ

ノートブックで使用されるインスタンスのタイプです。

IAM ロール

SageMaker ノートブックの作成に使用された IAM ロールです。

このロールには、SageMaker への信頼関係があります。このロールは AWS Identity and Access Management (IAM) コンソールで作成します。ロールを作成するときに、[Amazon SageMaker] を選択し、その後ノートブックのポリシー [AWSGlueServiceSageMakerNotebookRoleDefault] などをアタッチします。詳細については、「ステップ 7: SageMaker ノートブック用に IAM ロールを作成する」を参照してください。

AWS Glue コンソールでの Zeppelin ノートブックサーバー

Apache Zeppelin ノートブックサーバーのいくつかのプロパティを次に示します。ノートブックの詳細を表示すると、コンソールにはこれらのプロパティの一部が表示されます。

ノートブックサーバーの名前

Zeppelin ノートブックサーバーの一意の名前です。

開発エンドポイント

エンドポイントを作成するときに付与する一意の名前。

プロビジョニングのステータス

ノートブックサーバーが [CREATE_COMPLETE] または [ROLLBACK_COMPLETE] かどうかを説明します。

失敗の理由

ステータスが [Failed] の場合、ノートブックの理由が失敗します。

CloudFormation スタック

ノートブックサーバーの作成に使用された AWS CloudFormation スタックの名前です。

EC2 インスタンス

ノートブックをホストするために作成される Amazon EC2 インスタンスの名前です。これは Amazon EC2 コンソール (https://console.aws.amazon.com/ec2/) にリンクしており、インスタンスは [aws-glue-dev-endpoint] というキーと開発エンドポイントの名前の値でタグ付けされています。

SSH から EC2 サーバーへのコマンド

このコマンドをターミナルウィンドウに入力して、ノートブックサーバーを実行している Amazon EC2 インスタンスに接続します。このコマンドに表示される Amazon EC2 アドレスは、[Attach a public IP to the notebook server EC2 instance] (ノートブックサーバー EC2 インスタンスにパブリック IP をアタッチする) を選択したかどうかによってパブリックまたはプライベートになります。

証明書のコピー

Zeppelin ノートブックサーバーを設定するのに必要なキーストアを、ノートブックサーバーをホストする Amazon EC2 インスタンスにコピーするための scp コマンドの例です。Amazon EC2 プライベートキーが格納されているディレクトリでターミナルウィンドウからコマンドを実行します。Amazon EC2 インスタンスにアクセスするためのキーは、-i オプションへのパラメータです。path-to-keystore-file を指定します。このコマンドの残りの部分は、Amazon EC2 サーバー上の開発エンドポイントプライベート SSH キーが配置されている場所です。

HTTPS URL

ノートブックサーバーを設定したら、この URL をブラウザに入力し、HTTPS を使用してノートブックに接続します。