Amazon Managed Service for Apache Flink は、以前は Amazon Kinesis Data Analytics for Apache Flink と呼ばれていました。
翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon Managed Service for Apache Flink (テーブル API) の使用を開始する
このセクションでは、Apache Flink 用 Managed Service の基本概念と、Table API と SQL を使用した Java でのアプリケーションの実装について説明します。同じアプリケーション内で異なる APIs を切り替える方法を示し、アプリケーションを作成およびテストするために使用できるオプションについて説明します。また、このガイドのチュートリアルを完了し、初めてアプリケーションを作成するのに必要なツールのインストール方法についても説明します。
トピック
Managed Service for Apache Flink アプリケーションのコンポーネントを確認する
注記
Managed Service for Apache Flink は、すべての Apache Flink APIs
データを処理するために、Managed Service for Apache Flink アプリケーションは、入力を処理し、Apache Flink ランタイムを使用して出力を生成する Java アプリケーションを使用します。
一般的な Apache Flink アプリケーションには、次のコンポーネントがあります。
-
ランタイムプロパティ: ランタイムプロパティを使用して、コードを変更して再発行することなく、設定パラメータをアプリケーションに渡すことができます。
-
ソース: アプリケーションは 1 つ以上のソースからのデータを消費します。ソースはコネクタ
を使用して、Kinesis データストリームや Amazon MSK トピックなどの外部システムからデータを読み込みます。開発またはテストの場合、ソースをランダムに [テストデータを で生成します。詳細については、「Managed Service for Apache Flink にストリーミングデータソースを追加する」を参照してください。SQL またはテーブル API では、ソースはソーステーブルとして定義されます。 -
変換: アプリケーションは、データをフィルタリング、強化、または集計できる 1 つ以上の変換を通じてデータを処理します。SQL またはテーブル API を使用する場合、変換はテーブルまたはビューに対するクエリとして定義されます。
-
シンク: アプリケーションはシンクを介して外部システムにデータを送信します。シンクはコネクタ
を使用して、Kinesis データストリーム、Amazon MSK トピック、Amazon S3 バケット、リレーショナルデータベースなどの外部システムにデータを送信します。また、特別なコネクタを使用して、開発のみを目的として出力を印刷することもできます。SQL またはテーブル API を使用する場合、シンクは結果を挿入するシンクテーブルとして定義されます。詳細については、「Managed Service for Apache Flink でシンクを使用してデータを書き込む」を参照してください。
アプリケーションには、アプリケーションが使用する Flink コネクタや Java ライブラリなど、いくつかの外部依存関係が必要です。Amazon Managed Service for Apache Flink で を実行するには、アプリケーションを依存関係とともに fat-JAR にパッケージ化し、Amazon S3 バケットにアップロードする必要があります。次に、Apache Flink アプリケーション用 Managed Serviceを作成します。コードパッケージの場所を、他のランタイム設定パラメータとともに渡します。このチュートリアルでは、Apache Maven を使用してアプリケーションをパッケージ化し、選択した IDE でアプリケーションをローカルで実行する方法を示します。
必要な前提条件を満たす
このチュートリアルを開始する前に、Amazon Managed Service for Apache Flink (DataStream API) の使用を開始する の最初の 2 つのステップを完了してください。
開始するには、 アプリケーションの作成 を参照してください。