依存リソースを作成するローカルの開発環境のセットアップ Apache Flink Streaming Java Code のダウンロードと検証サンプルレコードを入力ストリームに書き込むアプリケーションをローカルで実行する Kinesis ストリームで入出力データを監視するローカルで実行されているアプリケーションを停止するアプリケーションコードをコンパイルしてパッケージ化するアプリケーションコード JAR ファイルをアップロードする Managed Service for Apache Flink アプリケーションの作成と設定次のステップ

Apache Flink アプリケーション用 Managed Serviceを作成して実行する

このステップでは、ソースとシンクとして Kinesis データストリームを使用して Managed Service for Apache Flink アプリケーションを作成します。

このセクションには、以下のステップが含まれています。

依存リソースを作成する
ローカルの開発環境のセットアップ
Apache Flink Streaming Java Code のダウンロードと検証
サンプルレコードを入力ストリームに書き込む
アプリケーションをローカルで実行する
Kinesis ストリームで入出力データを監視する
ローカルで実行されているアプリケーションを停止する
アプリケーションコードをコンパイルしてパッケージ化する
アプリケーションコード JAR ファイルをアップロードする
Managed Service for Apache Flink アプリケーションの作成と設定
次のステップ

依存リソースを作成する

この練習用の Managed Service for Apache Flink を作成する前に、以下の依存リソースを作成します。

入出力用の 2 つの Kinesis データストリーム
アプリケーションのコードを保存する Amazon S3 バケット

注記
このチュートリアルでは、アプリケーションを us-east-1 米国東部 (バージニア北部) リージョンにデプロイすることを前提としています。別のリージョンを使用する場合は、それに応じてすべてのステップを調整します。

2 つの Amazon Kinesis Data Streams を作成する

この演習で Apache Flink アプリケーションのマネージドサービスを作成する前に、2 つの Kinesis データストリーム (ExampleInputStream と ExampleOutputStream) を作成する必要があります。アプリケーションでは、これらのストリームを使用してアプリケーションの送信元と送信先のストリームを選択します。

これらのストリームは、Amazon Kinesis コンソールまたは次の AWS CLI コマンドを使用して作成できます。コンソールでの操作方法については、「Amazon Kinesis Data Streams デベロッパーガイド」の「データストリームの作成および更新」を参照してください。を使用してストリームを作成するには AWS CLI、次のコマンドを使用し、アプリケーションに使用するリージョンに合わせて調整します。

データストリームを作成するには (AWS CLI)

最初のストリーム (ExampleInputStream) を作成するには、次の Amazon Kinesis create-stream AWS CLI コマンドを使用します。
```
$ aws kinesis create-stream \
--stream-name ExampleInputStream \
--shard-count 1 \
--region us-east-1 \
```
アプリケーションが出力の書き込みに使用する 2 番目のストリームを作成するには、同じコマンドを実行し、ストリーム名をに変更しますExampleOutputStream。
```
$ aws kinesis create-stream \
--stream-name ExampleOutputStream \
--shard-count 1 \
--region us-east-1 \
```

アプリケーションコードの Amazon S3 バケットを作成する

Amazon S3 バケットは、コンソールを使用して作成できます。コンソールを使用して Amazon S3 バケットを作成する方法については、「Amazon Amazon S3ユーザーガイド」の「バケットの作成」を参照してください。ログイン名を追加するなど、グローバルに一意の名前を使用して Amazon S3 バケットに名前を付けます。

注記

このチュートリアルで使用するリージョン (us-east-1) にバケットを作成してください。

その他のリソース

アプリケーションを作成すると、Managed Service for Apache Flink は、次の Amazon CloudWatch リソースがまだ存在しない場合、自動的に作成します。

/AWS/KinesisAnalytics-java/<my-application>という名前のロググループ。
kinesis-analytics-log-stream というログストリーム

ローカルの開発環境のセットアップ

開発とデバッグでは、選択した IDE から直接マシンで Apache Flink アプリケーションを実行できます。Apache Flink の依存関係は、Apache Maven を使用して通常の Java の依存関係のように処理されます。

注記

開発マシンには、Java JDK 11、Maven、Git がインストールされている必要があります。Eclipse Java Neon や IntelliJ IDEA などの開発環境を使用することをお勧めします。すべての前提条件を満たしていることを確認するには、「」を参照してください演習を完了するための前提条件を満たす。マシンに Apache Flink クラスターをインストールする必要はありません。

セッションを認証する AWS

アプリケーションは Kinesis データストリームを使用してデータを公開します。ローカルで実行する場合は、Kinesis データストリームに書き込むアクセス許可を持つ有効な AWS 認証済みセッションが必要です。セッションを認証するには、次の手順に従います。

AWS CLI と、有効な認証情報が設定された名前付きプロファイルがない場合は、「」を参照してくださいAWS Command Line Interface （AWS CLI) のセットアップ。
AWS CLI が正しく設定されており、ユーザーが次のテストレコードを発行して Kinesis データストリームに書き込むアクセス許可を持っていることを確認します。
```
$ aws kinesis put-record --stream-name ExampleOutputStream --data TEST --partition-key TEST
```
IDE に統合するプラグインがある場合は AWS、それを使用して IDE で実行されているアプリケーションに認証情報を渡すことができます。詳細については、AWS 「 Toolkit for IntelliJ IDEA」およびAWS 「 Toolkit for Eclipse」を参照してください。

Apache Flink Streaming Java Code のダウンロードと検証

この例の Java アプリケーションコードは GitHub から入手できます。アプリケーションコードをダウンロードするには、次の操作を行います。

次のコマンドを使用してリモートリポジトリのクローンを作成します。
```
git clone https://github.com/aws-samples/amazon-managed-service-for-apache-flink-examples.git
```
amazon-managed-service-for-apache-flink-examples/tree/main/java/GettingStarted ディレクトリに移動します。

アプリケーションコンポーネントを確認する

アプリケーションは com.amazonaws.services.msf.BasicStreamingJob クラスに完全に実装されています。main() メソッドは、ストリーミングデータを処理して実行するデータフローを定義します。

注記

開発者エクスペリエンスを最適化するために、アプリケーションは Amazon Managed Service for Apache Flink とローカルの両方でコードを変更せずに実行され、IDE で開発できるように設計されています。

Amazon Managed Service for Apache Flink および IDE でを実行するときに動作するようにランタイム設定を読み取るために、アプリケーションは IDE でローカルでスタンドアロンで実行されているかどうかを自動的に検出します。この場合、アプリケーションはランタイム設定を異なる方法でロードします。
1. アプリケーションが IDE でスタンドアロンモードで実行されていることを検出したら、プロジェクトのリソースフォルダに含まれる application_properties.json ファイルを作成します。ファイルの内容は次のとおりです。
2. アプリケーションが Amazon Managed Service for Apache Flink で実行されると、デフォルトの動作により、Amazon Managed Service for Apache Flink アプリケーションで定義するランタイムプロパティからアプリケーション設定がロードされます。「Managed Service for Apache Flink アプリケーションの作成と設定」を参照してください。
```
private static Map<String, Properties> loadApplicationProperties(StreamExecutionEnvironment env) throws IOException {
    if (env instanceof LocalStreamEnvironment) {
        LOGGER.info("Loading application properties from '{}'", LOCAL_APPLICATION_PROPERTIES_RESOURCE);
        return KinesisAnalyticsRuntime.getApplicationProperties(
                BasicStreamingJob.class.getClassLoader()
                        .getResource(LOCAL_APPLICATION_PROPERTIES_RESOURCE).getPath());
    } else {
        LOGGER.info("Loading application properties from Amazon Managed Service for Apache Flink");
        return KinesisAnalyticsRuntime.getApplicationProperties();
    }
}
```

main() メソッドは、アプリケーションデータフローを定義して実行します。
- デフォルトのストリーミング環境を初期化します。この例では、DataSteam API StreamExecutionEnvironmentで使用すると SQL および Table API StreamTableEnvironmentで使用するの両方を作成する方法を示します。2 つの環境オブジェクトは、異なる APIs。
```
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
```
- アプリケーション設定パラメータをロードします。これにより、アプリケーションが実行されている場所に応じて、正しい場所から自動的にロードされます。
```
Map<String, Properties> applicationParameters = loadApplicationProperties(env);
```
- アプリケーションは、Kinesis Consumer コネクタを使用して入力ストリームからデータを読み取るソースを定義します。入力ストリームの設定は、 PropertyGroupId= で定義されますInputStream0。ストリームの名前とリージョンは、aws.regionそれぞれ stream.nameおよびという名前のプロパティにあります。わかりやすくするために、このソースはレコードを文字列として読み取ります。
```
private static FlinkKinesisConsumer<String> createSource(Properties inputProperties) {
    String inputStreamName = inputProperties.getProperty("stream.name");
    return new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties);
}
...

public static void main(String[] args) throws Exception { 
   ...
   SourceFunction<String> source = createSource(applicationParameters.get("InputStream0"));
   DataStream<String> input = env.addSource(source, "Kinesis Source");  
   ...
}    
```
- 次に、アプリケーションは Kinesis Streams Sink コネクタを使用してシンクを定義し、出力ストリームにデータを送信します。出力ストリーム名とリージョンはOutputStream0、入力ストリームと同様に PropertyGroupId= で定義されます。シンクは、ソースからデータを取得DataStreamしている内部に直接接続されます。実際のアプリケーションでは、ソースとシンクの間に何らかの変換があります。
```
private static KinesisStreamsSink<String> createSink(Properties outputProperties) {
    String outputStreamName = outputProperties.getProperty("stream.name");
    return KinesisStreamsSink.<String>builder()
            .setKinesisClientProperties(outputProperties)
            .setSerializationSchema(new SimpleStringSchema())
            .setStreamName(outputStreamName)
            .setPartitionKeyGenerator(element -> String.valueOf(element.hashCode()))
            .build();
}
...
public static void main(String[] args) throws Exception { 
   ...
   Sink<String> sink = createSink(applicationParameters.get("OutputStream0"));
   input.sinkTo(sink);
   ...
}    
```
- 最後に、先ほど定義したデータフローを実行します。これは、データフローに必要なすべての演算子を定義した後、 main()メソッドの最後の命令である必要があります。
```
env.execute("Flink streaming Java API skeleton");
```

pom.xml ファイルを使用する

pom.xml ファイルは、アプリケーションに必要なすべての依存関係を定義し、Flink に必要なすべての依存関係を含む fat-jar を構築するように Maven Shade プラグインを設定します。

一部の依存関係にはprovidedスコープがあります。これらの依存関係は、アプリケーションが Amazon Managed Service for Apache Flink で実行されるときに自動的に使用できます。アプリケーションをコンパイルしたり、IDE でアプリケーションをローカルで実行したりするために必要です。詳細については、「アプリケーションをローカルで実行する」を参照してください。Amazon Managed Service for Apache Flink で使用するランタイムと同じ Flink バージョンを使用していることを確認してください。
```
<dependency>
    <groupId>org.apache.flink</groupId>
    <artifactId>flink-clients</artifactId>
    <version>${flink.version}</version>
    <scope>provided</scope>
</dependency>
<dependency>
    <groupId>org.apache.flink</groupId>
    <artifactId>flink-streaming-java</artifactId>
    <version>${flink.version}</version>
    <scope>provided</scope>
</dependency>
```

このアプリケーションで使用される Kinesis コネクタなど、デフォルトのスコープを持つ pom に Apache Flink 依存関係を追加する必要があります。詳細については、「Apache Flink コネクタを使用する」を参照してください。アプリケーションに必要な追加の Java 依存関係を追加することもできます。
```
<dependency>
    <groupId>org.apache.flink</groupId>
    <artifactId>flink-connector-kinesis</artifactId>
    <version>${aws.connector.version}</version>
</dependency>
```

Maven Java Compiler プラグインは、コードが Apache Flink で現在サポートされている JDK バージョンである Java 11 に対してコンパイルされていることを確認します。
Maven Shade プラグインは、ランタイムによって提供される一部のライブラリを除き、fat-jar をパッケージ化します。また、 ServicesResourceTransformerとの 2 つのトランスフォーマーも指定しますManifestResourceTransformer。後者は、 mainメソッドを含むクラスを設定して、アプリケーションを起動します。メインクラスの名前を変更する場合は、このトランスフォーマーを更新することを忘れないでください。


<plugin>
    <groupId>org.apache.maven.plugins</groupId>
    <artifactId>maven-shade-plugin</artifactId>
    ...
        <transformer implementation="org.apache.maven.plugins.shade.resource.ManifestResourceTransformer">
            <mainClass>com.amazonaws.services.msf.BasicStreamingJob</mainClass>
        </transformer>
    ...
</plugin>

サンプルレコードを入力ストリームに書き込む

このセクションでは、アプリケーションが処理するサンプルレコードをストリームに送信します。Python スクリプトまたは Kinesis Data Generator を使用してサンプルデータを生成するには、2 つのオプションがあります。

Python スクリプトを使用してサンプルデータを生成する

Python スクリプトを使用して、サンプルレコードをストリームに送信できます。

注記

この Python スクリプトを実行するには、Python 3.x を使用し、AWS SDK for Python (Boto) ライブラリがインストールされている必要があります。

Kinesis 入力ストリームへのテストデータの送信を開始するには：

Data Generator GitHub stock.py リポジトリから Data Generator Python スクリプトをダウンロードします。 GitHub
stock.py スクリプトを実行します。
```
$ python stock.py
```

チュートリアルの残りの部分を完了する間は、スクリプトを実行したままにします。Apache Flink アプリケーションを実行できるようになりました。

Kinesis Data Generator を使用してサンプルデータを生成する

Python スクリプトを使用する代わりに、ホストバージョンでも利用可能な Kinesis Data Generator を使用して、ランダムなサンプルデータをストリームに送信できます。Kinesis Data Generator はブラウザで実行され、マシンに何もインストールする必要はありません。

Kinesis Data Generator をセットアップして実行するには：

Kinesis Data Generator ドキュメントの指示に従って、ツールへのアクセスを設定します。ユーザーとパスワードを設定する AWS CloudFormation テンプレートを実行します。
CloudFormation テンプレートによって生成された URL から Kinesis Data Generator にアクセスします。CloudFormation テンプレートが完了すると、出力タブに URL が表示されます。
データジェネレーターを設定します。
- リージョン： このチュートリアルで使用しているリージョンを選択します: us-east-1
- ストリーム/配信ストリーム： アプリケーションが使用する入力ストリームを選択します。 ExampleInputStream
- 1 秒あたりのレコード数： 100
- レコードテンプレート： 次のテンプレートをコピーして貼り付けます。
```
{
  "event_time" : "{{date.now("YYYY-MM-DDTkk:mm:ss.SSSSS")}},
  "ticker" : "{{random.arrayElement(
        ["AAPL", "AMZN", "MSFT", "INTC", "TBV"]
    )}}",
  "price" : {{random.number(100)}}          
} 
```
テンプレートをテストする: テストテンプレートを選択し、生成されたレコードが次のようになっていることを確認します。
```
{ "event_time" : "2024-06-12T15:08:32.04800, "ticker" : "INTC", "price" : 7 }
```
データジェネレーターを起動する: データ送信の選択を選択します。

Kinesis Data Generator は現在、にデータを送信していますExampleInputStream。

アプリケーションをローカルで実行する

Flink アプリケーションを IDE のローカルで実行およびデバッグできます。

注記

続行する前に、入力ストリームと出力ストリームが使用可能であることを確認します。「2 つの Amazon Kinesis Data Streams を作成する」を参照してください。また、両方のストリームから読み書きするアクセス許可があることを確認します。「セッションを認証する AWS」を参照してください。

ローカル開発環境をセットアップするには、Java 11 JDK、Apache Maven、および IDE for Java 開発が必要です。必要な前提条件を満たしていることを確認します。「演習を完了するための前提条件を満たす」を参照してください。

Java プロジェクトを IDE にインポートする

IDE でアプリケーションの使用を開始するには、それを Java プロジェクトとしてインポートする必要があります。

クローンしたリポジトリには、複数の例が含まれています。各例は個別のプロジェクトです。このチュートリアルでは、 ./java/GettingStartedサブディレクトリのコンテンツを IDE にインポートします。

Maven を使用して、コードを既存の Java プロジェクトとして挿入します。

注記

新しい Java プロジェクトをインポートする正確なプロセスは、使用している IDE によって異なります。

ローカルアプリケーション設定を確認する

ローカルで実行する場合、アプリケーションはのプロジェクトのリソースフォルダにある application_properties.json ファイルの設定を使用します./src/main/resources。このファイルを編集して、異なる Kinesis ストリーム名またはリージョンを使用できます。


[
  {
    "PropertyGroupId": "InputStream0",
    "PropertyMap": {
      "stream.name": "ExampleInputStream",
      "flink.stream.initpos": "LATEST",
      "aws.region": "us-east-1"
    }
  },
  {
    "PropertyGroupId": "OutputStream0",
    "PropertyMap": {
      "stream.name": "ExampleOutputStream",
      "aws.region": "us-east-1"
    }
  }
]

IDE 実行設定をセットアップする

任意の Java アプリケーションを実行する場合と同様にcom.amazonaws.services.msf.BasicStreamingJob、メインクラスを実行することで、IDE から直接 Flink アプリケーションを実行およびデバッグできます。アプリケーションを実行する前に、実行設定をセットアップする必要があります。セットアップは、使用している IDE によって異なります。例えば、IntelliJ IDEA ドキュメントの「実行/デバッグ設定」を参照してください。特に、以下を設定する必要があります。

クラスパスにprovided依存関係を追加します。これは、ローカルで実行するときに、providedスコープを持つ依存関係がアプリケーションに渡されるようにするために必要です。この設定を行わないと、アプリケーションはすぐにclass not foundエラーを表示します。
Kinesis ストリームにアクセスするための AWS 認証情報をアプリケーションに渡します。最も簡単な方法は、 AWS Toolkit for IntelliJ IDEA を使用することです。実行設定でこの IDE プラグインを使用すると、特定の AWS プロファイルを選択できます。 AWS 認証は、このプロファイルを使用して行われます。認証情報を直接渡す AWS 必要はありません。
IDE が JDK 11 を使用してアプリケーションを実行していることを確認します。

IDE でアプリケーションを実行する

の実行設定をセットアップしたらBasicStreamingJob、通常の Java アプリケーションのように実行またはデバッグできます。

注記

Maven によって生成された fat-jar をコマンドラインjava -jar ...からで直接実行することはできません。この jar には、アプリケーションをスタンドアロンで実行するために必要な Flink コア依存関係は含まれていません。

アプリケーションが正常に起動すると、スタンドアロンのミニクラスターとコネクタの初期化に関する情報がログに記録されます。この後、アプリケーションの起動時に Flink が通常出力する多数の INFO といくつかの WARN ログが続きます。


13:43:31,405 INFO  com.amazonaws.services.msf.BasicStreamingJob                 [] - Loading application properties from 'flink-application-properties-dev.json'
13:43:31,549 INFO  org.apache.flink.streaming.connectors.kinesis.FlinkKinesisConsumer [] - Flink Kinesis Consumer is going to read the following streams: ExampleInputStream, 
13:43:31,676 INFO  org.apache.flink.runtime.taskexecutor.TaskExecutorResourceUtils [] - The configuration option taskmanager.cpu.cores required for local execution is not set, setting it to the maximal possible value.
13:43:31,676 INFO  org.apache.flink.runtime.taskexecutor.TaskExecutorResourceUtils [] - The configuration option taskmanager.memory.task.heap.size required for local execution is not set, setting it to the maximal possible value.
13:43:31,676 INFO  org.apache.flink.runtime.taskexecutor.TaskExecutorResourceUtils [] - The configuration option taskmanager.memory.task.off-heap.size required for local execution is not set, setting it to the maximal possible value.
13:43:31,676 INFO  org.apache.flink.runtime.taskexecutor.TaskExecutorResourceUtils [] - The configuration option taskmanager.memory.network.min required for local execution is not set, setting it to its default value 64 mb.
13:43:31,676 INFO  org.apache.flink.runtime.taskexecutor.TaskExecutorResourceUtils [] - The configuration option taskmanager.memory.network.max required for local execution is not set, setting it to its default value 64 mb.
13:43:31,676 INFO  org.apache.flink.runtime.taskexecutor.TaskExecutorResourceUtils [] - The configuration option taskmanager.memory.managed.size required for local execution is not set, setting it to its default value 128 mb.
13:43:31,677 INFO  org.apache.flink.runtime.minicluster.MiniCluster             [] - Starting Flink Mini Cluster
....

初期化が完了すると、アプリケーションはそれ以上のログエントリを出力しません。データが流れる間は、ログは出力されません。

アプリケーションがデータを正しく処理しているかどうかを確認するには、次のセクションで説明するように、入出力 Kinesis ストリームを検査できます。

注記

フローデータに関するログを出力しないことは、Flink アプリケーションの通常の動作です。すべてのレコードにログを出力するとデバッグに便利ですが、本番稼働時にかなりのオーバーヘッドが発生する可能性があります。

Kinesis ストリームで入出力データを監視する

Amazon Kinesis コンソールのデータビューワーを使用して、 (生成サンプル Python) または Amazon Kinesis Data Generator (リンク) によって入力ストリームに送信されたレコードを確認できます。

レコードを監視するには

Kinesis コンソール (https://console.aws.amazon.com/kinesis) を開きます。
リージョンがこのチュートリアルを実行しているリージョンと同じであることを確認します。デフォルトでは us-east-1 US East (N. Virginia) です。リージョンが一致しない場合は変更します。
データストリームを選択します。
監視するストリームを ExampleInputStreamまたはのいずれかで選択します。 ExampleOutputStream.
データビューワータブを選択します。
任意のシャードを選択し、Latest を開始位置のままにして、レコードの取得を選択します。「このリクエストのレコードが見つかりません」というエラーが表示される場合があります。その場合は、レコードの取得を再試行を選択します。ストリーム表示に発行された最新のレコード。
データ列の値を選択して、レコードの内容を JSON 形式で検査します。

ローカルで実行されているアプリケーションを停止する

IDE で実行されているアプリケーションを停止します。IDE は通常、「停止」オプションを提供します。正確な場所と方法は、使用している IDE によって異なります。

アプリケーションコードをコンパイルしてパッケージ化する

このセクションでは、Apache Maven を使用して Java コードをコンパイルし、JAR ファイルにパッケージ化します。Maven コマンドラインツールまたは IDE を使用してコードをコンパイルしてパッケージ化できます。

Maven コマンドラインを使用してコンパイルおよびパッケージ化するには：

Java GettingStarted プロジェクトを含むディレクトリに移動し、次のコマンドを実行します。


$ mvn package

IDE を使用してコンパイルおよびパッケージ化するには：

IDE Maven 統合mvn packageからを実行します。

どちらの場合も、次の JAR ファイルが作成されます: target/amazon-msf-java-stream-app-1.0.jar。

注記

IDE から「ビルドプロジェクト」を実行しても、JAR ファイルが作成されない場合があります。

アプリケーションコード JAR ファイルをアップロードする

このセクションでは、前のセクションで作成した JAR ファイルを、このチュートリアルの冒頭で作成した Amazon Simple Storage Service (Amazon S3) バケットにアップロードします。このステップを完了していない場合は、 (リンク) を参照してください。

アプリケーションコード JAR ファイルをアップロードするには

Amazon S3 コンソール (https://console.aws.amazon.com/s3/) を開きます。
アプリケーションコード用に以前に作成したバケットを選択します。
アップロードを選択します。
ファイルの追加を選択します。
前のステップで生成された JAR ファイルに移動します。 target/amazon-msf-java-stream-app-1.0.jar
他の設定を変更せずにアップロードを選択します。

警告

で正しい JAR ファイルを選択していることを確認してください<repo-dir>/java/GettingStarted/target/amazon-msf-java-stream-app-1.0.jar。

target ディレクトリには、アップロードする必要のない他の JAR ファイルも含まれています。

Managed Service for Apache Flink アプリケーションの作成と設定

コンソールまたは AWS CLIのいずれかを使用してManaged Service for Apache Flink を作成し、実行することができます。このチュートリアルでは、コンソールを使用します。

注記

コンソールを使用してアプリケーションを作成すると、 AWS Identity and Access Management (IAM) リソースと Amazon CloudWatch Logs リソースが自動的に作成されます。を使用してアプリケーションを作成するときは AWS CLI、これらのリソースを個別に作成します。

アプリケーションの作成

アプリケーションを作成するには

にサインインし AWS Management Console、https://console.aws.amazon.com/flink で Amazon MSF コンソールを開きます。
正しいリージョンが選択されていることを確認します: us-east-1 米国東部 (バージニア北部）
右側のメニューを開き、Apache Flink アプリケーションを選択し、ストリーミングアプリケーションを作成します。または、最初のページの開始方法コンテナでストリーミングアプリケーションの作成を選択します。
ストリーミングアプリケーションの作成ページで、次の操作を行います。
- ストリーム処理アプリケーションを設定する方法を選択します。最初から作成を選択します。
- Apache Flink 設定、Application Flink バージョン： Apache Flink 1.20 を選択します。
アプリケーションを設定する
- アプリケーション名： と入力しますMyApplication。
- 説明： と入力しますMy java test app。
- アプリケーションリソースへのアクセス： 必要なポリシーkinesis-analytics-MyApplication-us-east-1を使用して IAM ロールを作成/更新を選択します。
アプリケーション設定用にテンプレートを設定する
- テンプレート： 開発を選択します。
ページの下部にある「ストリーミングアプリケーションの作成」を選択します。

注記

コンソールを使用して Apache Flink アプリケーション用 Managed Service を作成する場合は、IAM ロールとポリシーをアプリケーションが自動的に作成するオプションを選択できます。アプリケーションではこのロールとポリシーを使用して、依存リソースにアクセスします。これらの IAM リソースは、次のようにアプリケーション名とリージョンを使用して命名されます。

ポリシー: kinesis-analytics-service-MyApplication-us-east-1
ロール: kinesisanalytics-MyApplication-us-east-1

Amazon Managed Service for Apache Flink は、以前は Kinesis Data Analytics と呼ばれていました。下位互換性kinesis-analytics-のために、自動的に作成されるリソースの名前にはプレフィックスが付きます。

IAM ポリシーを編集する

IAM ポリシーを編集し、Kinesis Data Streamsにアクセスするための許可を追加します。

ポリシーを編集するには

IAM コンソール (https://console.aws.amazon.com/iam/) を開きます。
[ポリシー] を選択します。前のセクションでコンソールによって作成された kinesis-analytics-service-MyApplication-us-east-1 ポリシーを選択します。
編集を選択し、JSON タブを選択します。

次のポリシー例で強調表示されているセクションをポリシーに追加します。サンプルのアカウント ID (012345678901) を自分のアカウント ID に置き換えます。

ページの下部にある次へを選択し、変更の保存を選択します。

アプリケーションを設定する

アプリケーション設定を編集して、アプリケーションコードアーティファクトを設定します。

設定を編集するには

[MyApplication] ページで、[Congirue] を選択します。
アプリケーションコードの場所セクションで、次の操作を行います。
- Amazon S3 バケットでは、アプリケーションコード用に以前に作成したバケットを選択します。参照を選択して正しいバケットを選択し、選択を選択します。バケット名はクリックしないでください。
- [Amazon S3 オブジェクトへのパス] で、amazon-msf-java-stream-app-1.0.jarと入力します。
アクセス許可 で、必要なポリシーkinesis-analytics-MyApplication-us-east-1で IAM ロールを作成/更新を選択します。
ランタイムプロパティセクションで、次のプロパティを追加します。

新しい項目を追加を選択し、次の各パラメータを追加します。

グループ ID	キー	値
`InputStream0`	`stream.name`	`ExampleInputStream`
`InputStream0`	`aws.region`	`us-east-1`
`OutputStream0`	`stream.name`	`ExampleOutputStream`
`OutputStream0`	`aws.region`	`us-east-1`

他のセクションは変更しないでください。
[Save changes] (変更の保存) をクリックします。

注記

Amazon CloudWatch ログ記録を有効にすることを選択すると、ロググループとログストリームが Kinesis Data Analytics によって作成されます。これらのリソースの名前は次のとおりです。

ロググループ: /aws/kinesis-analytics/MyApplication
ログストリーム: kinesis-analytics-log-stream

アプリケーションを実行する

これでアプリケーションが設定され、実行する準備が整いました。

アプリケーションを実行するには

Amazon Managed Service for Apache Flink のコンソールで、アプリケーションを選択し、実行を選択します。
次のページのアプリケーション復元設定ページで、最新のスナップショットを使用して実行を選択し、次に実行を選択します。

アプリケーションのステータスの詳細は、アプリケーションの起動Running時にから Ready に移行Startingし、その後に移行します。

アプリケーションが Runningステータスになったら、Flink ダッシュボードを開くことができます。

ダッシュボードを開くには

Open Apache Flink ダッシュボードを選択します。ダッシュボードが新しいページで開きます。
実行中のジョブリストで、表示できる 1 つのジョブを選択します。

注記
ランタイムプロパティを設定したり、IAM ポリシーを誤って編集したりすると、アプリケーションのステータスがになることがありますがRunning、Flink ダッシュボードにはジョブが継続的に再起動していることが表示されます。これは、アプリケーションの設定が間違っているか、外部リソースへのアクセス許可がない場合の一般的な障害シナリオです。
この場合、Flink ダッシュボードの例外タブで問題の原因を確認します。

実行中のアプリケーションのメトリクスを確認する

MyApplication ページの Amazon CloudWatch メトリクスセクションには、実行中のアプリケーションの基本的なメトリクスの一部が表示されます。

メトリクスを表示するには

更新ボタンの横にあるドロップダウンリストから 10 秒を選択します。
アプリケーションが実行されていて正常であれば、稼働時間メトリクスが継続的に増加していることを確認できます。
完全再起動メトリクスはゼロである必要があります。増加している場合は、設定に問題がある可能性があります。問題を調査するには、Flink ダッシュボードの例外タブを確認します。
正常なアプリケーションで失敗したチェックポイントの数メトリクスは 0 である必要があります。

注記
このダッシュボードには、5 分の粒度の固定メトリクスのセットが表示されます。CloudWatch ダッシュボードでは、任意のメトリクスを使用してカスタムアプリケーションダッシュボードを作成できます。

Kinesis ストリームの出力データを確認する

Python スクリプトまたは Kinesis Data Generator を使用して、入力にデータを発行していることを確認します。

Managed Service for Apache Flink で実行されているアプリケーションの出力を、https://console.aws.amazon.com/kinesis/ のデータビューワーを使用して確認できるようになりました。

出力を表示するには

Kinesis コンソール (https://console.aws.amazon.com/kinesis) を開きます。
リージョンがこのチュートリアルの実行に使用しているリージョンと同じであることを確認します。デフォルトでは、us-east-1US East (バージニア北部) です。必要に応じてリージョンを変更します。
データストリームを選択します。
監視するストリームを選択します。このチュートリアルでは、ExampleOutputStream を使用します。
データビューワータブを選択します。
任意のシャードを選択し、Latest を開始位置のままにして、レコードの取得を選択します。「このリクエストのレコードが見つかりません」というエラーが表示される場合があります。その場合は、レコードの取得を再試行を選択します。ストリームディスプレイに発行された最新のレコード。
データ列の値を選択して、レコードの内容を JSON 形式で検査します。

アプリケーションを停止する

アプリケーションを停止するには、という名前の Managed Service for Apache Flink アプリケーションのコンソールページに移動しますMyApplication。

アプリケーションを停止するには

アクションドロップダウンリストから、停止を選択します。
アプリケーションのステータスの詳細がから Runningに移行しStopping、アプリケーションが完全に停止Readyするとに移行します。

注記
Python スクリプトまたは Kinesis Data Generator から入力ストリームへのデータ送信も停止することを忘れないでください。

次のステップ

AWS リソースをクリーンアップする

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

のセットアップ AWS CLI

リソースをクリーンアップする