Amazon MSK クラスターを設定する VPC に NAT ゲートウェイを追加する AWS Glue 接続およびテーブルを作成する Amazon MSK による Studio ノートブックの作成 Amazon MSK クラスターにデータを送信します。Studio ノートブックをテストします。

Amazon MSK による Studio ノートブックの作成

このチュートリアルでは、Amazon MSK クラスターをソースとして使用する Studio ノートブックを作成する方法について説明します。

このチュートリアルには、次のセクションが含まれています。

Amazon MSK クラスターを設定する
VPC に NAT ゲートウェイを追加する
AWS Glue 接続およびテーブルを作成する
Amazon MSK による Studio ノートブックの作成
Amazon MSK クラスターにデータを送信します。
Studio ノートブックをテストします。

Amazon MSK クラスターを設定する

このチュートリアルでは、プレーンテキストでアクセスできる Amazon MSK クラスターが必要です。Amazon MSK クラスターをまだセットアップしていない場合は、「Amazon MSK の使用入門」チュートリアルに従って、Amazon VPC、Amazon MSK クラスター、トピック、および Amazon EC2 クライアントインスタンスを作成してください。

チュートリアルを実行するときは、以下の手順を実行します。

「ステップ 3: Amazon MSK クラスターを作成する」のステップ 4 で、 ClientBroker 値を TLS から PLAINTEXT に変更します。

VPC に NAT ゲートウェイを追加する

「Amazon MSK の使用入門」チュートリアルに従って Amazon MSK クラスターを作成した場合、または既存の Amazon VPC にプライベートサブネット用の NAT ゲートウェイがまだない場合は、Amazon VPC に NAT ゲートウェイを追加する必要があります。アーキテクチャを次の図に示します。

AWS VPC architecture with public and private subnets, NAT gateway, and Glue Data Catalog integration.

Amazon VPC 用の NAT ゲートウェイを作成するには、次の操作を行います。

Amazon VPC コンソールの https://console.aws.amazon.com/vpc/ を開いてください。
左のナビゲーションバーから、[NAT ゲートウェイ] を選択します。
「NAT ゲートウェイ」ページで「NAT ゲートウェイの作成」を選択します。

[NAT ゲートウェイの作成] ページで、以下の値を入力します。

名前 - オプション	`ZeppelinGateway`
サブネット	AWSKafkaTutorialSubnet1
Elastic IP 割り当て ID	Choose an available Elastic IP. If there are no Elastic IPs available, choose Elastic IP の割り当て, and then choose the Elasic IP that the console creates.

[Create NAT Gateway] (NAT ゲートウェイの作成) を選択します。

左のナビゲーションバーで、[ルートテーブル ] を選択します。
[ルートテーブルの作成] を選択します。
[ルートテーブルの作成] ページで、以下の情報を指定します。
- 名前タグ: ZeppelinRouteTable
- 「VPC」: 自分の VPC (例:「AWSKafkaTutorialVPC」)を選択します。
[作成] を選択します。
ルートテーブルのリストから「ZeppelinRouteTable」を選択します。[ルート] タブを選択し、[ルート編集] を選択します。
[ルートの編集] ページで、[ルートの追加] を選択します。
[送信先] に「0.0.0.0/0」と入力します。「Target」には「NAT ゲートウェイ」、「ZeppelinGateway」。[ルートの保存] を選択します。[閉じる] を選択してください。
「ルートテーブル」ページで「ZeppelinRouteTable」を選択した状態で、「サブネット関連付け」タブを選択します。「サブネット関連付けの編集」を選択します。
「サブネット関連付けの編集」ページで、「AWSKafkaTutorialSubnet2」と「AWSKafkaTutorialSubnet3」を選択します。[保存] を選択します。

AWS Glue 接続およびテーブルを作成する

Studio ノートブックは、Amazon MSK データソースに関するメタデータ用の「AWS Glue」データベースを使用します。このセクションでは、Amazon MSK クラスターへのアクセス方法を説明する AWS Glue 接続と、Studio Notebook などのクライアントにデータソース内のデータを表示する方法を説明する AWS Glue テーブルを作成します。

接続を作成する

AWS マネジメントコンソールにサインインし、AWS Glue コンソール (https://console.aws.amazon.com/glue/) を開きます。
「AWS Glue」データベースをまだお持ちでない場合は、左側のナビゲーションバーから「データベース」を選択します。[データベースの追加] を選択します。[データベースの追加] ウィンドウで、[データベース名] に default を入力します。[作成] を選択します。
左のナビゲーションバーから、[接続]を選択します。[接続の追加] を選択します。
「接続を追加」ウィンドウで、次の値を入力します。
- [接続名] に、ZeppelinConnection と入力します。
- [接続タイプ] で、[Kafka] を選択します。
- 「Kafka ブートストラップサーバー URL」には、クラスターのブートストラップブローカーの文字列を指定します。ブートストラップブローカーは、MSK コンソールから、または次の CLI コマンドを入力して取得できます。
```
aws kafka get-bootstrap-brokers --region us-east-1 --cluster-arn ClusterArn
```
- 「SSL 接続が必要」チェックボックスをオフにします。
[次へ] を選択します。
[VPC] ページで、次の値を入力します。
- 「VPC」の場合は、VPC の名前を選択します (例えば「AWSKafkaTutorialVPC」)。
- 「サブネット」には、「AWSKafkaTutorialSubnet2」を選択します。
- 「セキュリティグループ」では、使用可能なすべてのグループを選択します。
[次へ] を選択します。
「接続プロパティ」/「接続アクセス」ページで「完了」を選択します。

テーブルを作成する

注記

次の手順で説明するように手動でテーブルを作成することも、Apache Zeppelin 内のノートブックにある Apache Flink 用 Managed Service のテーブル作成コネクタコードを使用して DDL ステートメントでテーブルを作成することもできます。次に、AWS Glue にチェックインして、テーブルが正しく作成されたことを確認できます。

左のナビゲーションバーで、[テーブル] を選択します。「テーブル」ページで、「テーブルを追加」、「テーブルを手動で追加」を選択します。
「テーブルのプロパティの設定」ページで、「テーブル名」に stock を入力します。以前に作成したデータベースを選択していることを確認してください。[次へ] を選択します。
「データストアの追加」ページで「Kafka」を選択します。トピック名には、「トピック名」 (「AWSKafkaTutorialTopic」など) を入力します。「接続」には「ZeppelinConnection」を選択します。
「分類」ページで「JSON」を選択します。[次へ] を選択します。

スキーマを定義するで、[Add column] を編集して列を追加します。以下のプロパティを持つ列を追加します。

列名	データ型
`ticker`	`文字列`
`料金`	`double`

[次へ] を選択します。

次のページで設定を確認し、「終了」を選択します。
テーブルの一覧で、新しく作成したテーブルを選択します。
[テーブルを編集] を選択し、次のプロパティを追加します。
- キー: managed-flink.proctime、値: proctime
- キー: flink.properties.group.id、値: test-consumer-group
- キー: flink.properties.auto.offset.reset、値: latest
- キー: classification、値: json
これらのキーと値のペアがないと、Flink ノートブックにエラーが発生します。
[Apply] (適用) を選択します。

Amazon MSK による Studio ノートブックの作成

アプリケーションで使用するリソースを作成したので、次は Studio ノートブックを作成します。

AWS マネジメントコンソールまたは AWS CLI を使用してアプリケーションを作成できます。

AWS マネジメントコンソールを使用して Studio ノートブックを作成します
AWS CLI を使用して Studio ノートブックを作成します

注記

Amazon MSK コンソールから既存のクラスターを選択し、「データをリアルタイムで処理」を選択することで Studio ノートブックを作成することもできます。

AWS マネジメントコンソールを使用して Studio ノートブックを作成します

「https://console.aws.amazon.com/managed-flink/home?region=us-east-1#/applications/dashboard」にある Apache Flink コンソール用 Managed Service を開きます。
「Apache Flink アプリケーション用 Managed Service」ページで、「Studio」タブを選択します。「Studio ノートブックの作成」を選択します。

注記
Amazon MSK または Kinesis Data Streams コンソールから Studio ノートブックを作成するには、入力の Amazon MSK クラスターまたは Kinesis データストリームを選択し、「データをリアルタイムで処理」を選択します。
[Studio ノートブックの作成] ページで、次の情報を入力します。
- 「Studio ノートブック名」に MyNotebook を入力します。
- 「AWSGlue データベース」の「デフォルト」を選択します。
「Studio ノートブックの作成」を選択します。
「MyNotebook」ページで、「構成」タブを選択します。「Networking」セクションで、「編集」を選択します。
「MyNotebook のネットワークの編集」ページで、「Amazon MSK クラスターに基づく VPC 設定」を選択します。「Amazon MSK クラスター」には Amazon MSK クラスターを選択します。[Save changes] (変更の保存) をクリックします。
「MyNotebook」ページで、「実行」を選択します。「ステータス」に「実行中」が表示されるまで待ちます。

AWS CLI を使用して Studio ノートブックを作成します

AWS CLI を使用して Studio ノートブックを作成するには、次の操作を行います。

次の情報があることを確認します。アプリケーションを作成するにはこれらの値が必要です。
- アカウント ID。
- Amazon MSK クラスターを含む Amazon VPC 用のサブネット ID やセキュリティグループ ID。

create.json というファイルを次の内容で作成します。プレースホルダー値を、ユーザー自身の情報に置き換えます。


{
    "ApplicationName": "MyNotebook",
    "RuntimeEnvironment": "ZEPPELIN-FLINK-3_0",
    "ApplicationMode": "INTERACTIVE",
    "ServiceExecutionRole": "arn:aws:iam::AccountID:role/ZeppelinRole",
    "ApplicationConfiguration": {
        "ApplicationSnapshotConfiguration": {
            "SnapshotsEnabled": false
        },
        "VpcConfigurations": [
            {
                "SubnetIds": [
                    "SubnetID 1",
                    "SubnetID 2",
                    "SubnetID 3"
                ],
                "SecurityGroupIds": [
                    "VPC Security Group ID"
                ]
            }
        ],
        "ZeppelinApplicationConfiguration": {
            "CatalogConfiguration": {
                "GlueDataCatalogConfiguration": {
                    "DatabaseARN": "arn:aws:glue:us-east-1:AccountID:database/default"
                }
            }
        }
    }
}

アプリケーションを作成するには、次のコマンドを実行します。
```
aws kinesisanalyticsv2 create-application --cli-input-json file://create.json 
```

コマンドが完了すると、次のような出力が表示され、新しい Studio ノートブックの詳細が表示されます。


{
    "ApplicationDetail": {
        "ApplicationARN": "arn:aws:kinesisanalyticsus-east-1:012345678901:application/MyNotebook",
        "ApplicationName": "MyNotebook",
        "RuntimeEnvironment": "ZEPPELIN-FLINK-3_0",
        "ApplicationMode": "INTERACTIVE",
        "ServiceExecutionRole": "arn:aws:iam::012345678901:role/ZeppelinRole",
...

アプリケーションを起動するには、次のコマンドを実行します。サンプル値をアカウント ID に置き換えます。
```
aws kinesisanalyticsv2 start-application --application-arn arn:aws:kinesisanalyticsus-east-1:012345678901:application/MyNotebook\
```

Amazon MSK クラスターにデータを送信します。

このセクションでは、Amazon EC2 クライアントで Python スクリプトを実行して Amazon MSK データソースにデータを送信します。

Amazon EC2 クライアントに接続します。
以下のコマンドを実行して Python バージョン 3、Pip、および Kafka for Python パッケージをインストールし、アクションを確認します。
```
sudo yum install python37
curl -O https://bootstrap.pypa.io/get-pip.py
python3 get-pip.py --user
pip install kafka-python
```
以下のコマンドを入力して、クライアントマシン上で AWS CLI を構成します。
```
aws configure
```
アカウントの認証情報と us-east-1 を region に入力します。

stock.py というファイルを次の内容で作成します。サンプル値を Amazon MSK クラスターのブートストラップブローカー文字列に置き換え、トピックが「AWSKafkaTutorialTopic」でない場合はトピック名を更新します。


from kafka import KafkaProducer
import json
import random
from datetime import datetime

BROKERS = "<<Bootstrap Broker List>>"
producer = KafkaProducer(
    bootstrap_servers=BROKERS,
    value_serializer=lambda v: json.dumps(v).encode('utf-8'),
    retry_backoff_ms=500,
    request_timeout_ms=20000,
    security_protocol='PLAINTEXT')


def getStock():
    data = {}
    now = datetime.now()
    str_now = now.strftime("%Y-%m-%d %H:%M:%S")
    data['event_time'] = str_now
    data['ticker'] = random.choice(['AAPL', 'AMZN', 'MSFT', 'INTC', 'TBV'])
    price = random.random() * 100
    data['price'] = round(price, 2)
    return data


while True:
    data =getStock()
    # print(data)
    try:
        future = producer.send("AWSKafkaTutorialTopic", value=data)
        producer.flush()
        record_metadata = future.get(timeout=10)
        print("sent event to Kafka! topic {} partition {} offset {}".format(record_metadata.topic, record_metadata.partition, record_metadata.offset))
    except Exception as e:
        print(e.with_traceback())

次のコマンドを使用してスクリプトを実行します。
```
$ python3 stock.py
```
以下のセクションを実行している間は、スクリプトを実行したままにしておきます。

Studio ノートブックをテストします。

このセクションでは、Studio ノートブックを使用して Amazon MSK クラスターのデータをクエリします。

「https://console.aws.amazon.com/managed-flink/home?region=us-east-1#/applications/dashboard」にある Apache Flink 用 Managed Serviceコンソールを開きます。
[Apache Flink アプリケーション用 Managed Service] ページで、[Studio ノートブック] タブを選択します。「MyNotebook」を選択します。
「MyNotebook」ページで、[Apache Zeppelin で開く] を選択します。

新しいタブで Apache Zeppelin インターフェイスが開きます。
「Zeppelinへようこそ！」でページで「Zeppelinの新ノート」を選択します。
「Zeppelin Note」ページで、新しいノートに次のクエリを入力します。
```
%flink.ssql(type=update)
select * from stock
```
実行アイコンを選択します。

アプリケーションは Amazon MSK クラスターのデータを表示します。

アプリケーションの Apache Flink ダッシュボードを開いて運用状況を表示するには、「FLINK JOB」を選択します。Flink Dashboard の詳細については、「Managed Service for Apache Flink デベロッパーガイド」の「Apache Flink ダッシュボード」を参照してください。

Flink ストリーミング SQL クエリの他の例については、「Apache Flink ドキュメント」の「クエリ」を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

Kinesis Data Streams を使用した Studio ノートブックの作成

アプリケーションおよび依存関係リソースをクリーンアップする

Amazon MSK による Studio ノートブックの作成

このチュートリアルには、次のセクションが含まれています。

Amazon MSK クラスターを設定する

VPC に NAT ゲートウェイを追加する

AWS Glue 接続およびテーブルを作成する

接続を作成する

テーブルを作成する

注記

Amazon MSK による Studio ノートブックの作成

AWS マネジメントコンソール または AWS CLI を使用してアプリケーションを作成できます。

注記

AWS マネジメントコンソール を使用して Studio ノートブックを作成します

注記

AWS CLI を使用して Studio ノートブックを作成します

Amazon MSK クラスターにデータを送信します。

Studio ノートブックをテストします。

AWS マネジメントコンソールまたは AWS CLI を使用してアプリケーションを作成できます。

AWS マネジメントコンソールを使用して Studio ノートブックを作成します