建立兩個 Amazon Kinesis 資料串流寫入範例記錄至輸入串流下載並檢查 Apache Flink 串流 Java 程式碼編譯應用程式程式碼上傳 Apache Flink 串流 Java 程式碼建立並執行 Managed Service for Apache Flink 應用程式

建立並執行 Managed Service for Apache Flink 應用程式

在本練習中，您會建立 Managed Service for Apache Flink 應用程式，並將資料串流作為來源和目的地。

本節包含下列步驟：

建立兩個 Amazon Kinesis 資料串流
寫入範例記錄至輸入串流
下載並檢查 Apache Flink 串流 Java 程式碼
編譯應用程式程式碼
上傳 Apache Flink 串流 Java 程式碼
建立並執行 Managed Service for Apache Flink 應用程式

建立兩個 Amazon Kinesis 資料串流

為此練習建立 Amazon Managed Service for Apache Flink 之前，請先建立兩個 Kinesis 資料串流 (ExampleInputStream 和 ExampleOutputStream)。您的應用程式會將這些串流用於應用程式來源和目的地串流。

您可以使用 Amazon Kinesis 主控台或以下 AWS CLI 命令來建立這些串流。如需主控台說明，請參閱建立及更新資料串流。

建立資料串流 (AWS CLI)

若要建立第一個串流 (ExampleInputStream)，請使用下列 Amazon Kinesis create-stream AWS CLI 命令。


$ aws kinesis create-stream \
--stream-name ExampleInputStream \
--shard-count 1 \
--region us-west-2 \
--profile adminuser

若要建立應用程式用來寫入輸出的第二個串流，請執行相同的命令，將串流名稱變更為 ExampleOutputStream。
```
$ aws kinesis create-stream \
--stream-name ExampleOutputStream \
--shard-count 1 \
--region us-west-2 \
--profile adminuser
```

寫入範例記錄至輸入串流

在本節，您會使用 Python 指令碼將範例記錄寫入供應用程式處理的串流。

注意

本節需要 AWS SDK for Python (Boto)。

使用下列內容建立名為 stock.py 的檔案：


 
import datetime
import json
import random
import boto3

STREAM_NAME = "ExampleInputStream"


def get_data():
    return {
        "EVENT_TIME": datetime.datetime.now().isoformat(),
        "TICKER": random.choice(["AAPL", "AMZN", "MSFT", "INTC", "TBV"]),
        "PRICE": round(random.random() * 100, 2),
    }


def generate(stream_name, kinesis_client):
    while True:
        data = get_data()
        print(data)
        kinesis_client.put_record(
            StreamName=stream_name, Data=json.dumps(data), PartitionKey="partitionkey"
        )


if __name__ == "__main__":
    generate(STREAM_NAME, boto3.client("kinesis"))

在教學課程後半段，您會執行 stock.py 指令碼來傳送資料至應用程式。
```
$ python stock.py
```

下載並檢查 Apache Flink 串流 Java 程式碼

此範例的 Java 應用程式碼可從 GitHub 下載。若要下載應用程式的程式碼，請執行下列動作：

使用以下指令複製遠端儲存庫：


git clone https://github.com/aws-samples/amazon-kinesis-data-analytics-java-examples.git

導覽至 GettingStarted 目錄。

應用程式碼位於 CustomSinkStreamingJob.java 和 CloudWatchLogSink.java 檔案。請留意下列與應用程式的程式碼相關的資訊：

應用程式使用 Kinesis 來源從來源串流讀取。以下程式碼片段會建立 Kinesis 目的地：


return env.addSource(new FlinkKinesisConsumer<>(inputStreamName,
                new SimpleStringSchema(), inputProperties));

編譯應用程式程式碼

在本節中，您會使用 Apache Maven 編譯器來建立應用程式的 Java 程式碼。如需安裝 Apache Maven 和 Java 開發套件 (JDK) 的相關資訊，請參閱完成練習的先決條件。

Java 應用程式需要下列元件：

專案物件模型 (pom.xml) 檔案。此檔案包含應用程式組態和相依性的相關資訊，包括 Amazon Managed Service for Apache Flink 程式庫。
包含應用程式邏輯的 main 方法。

注意

若要將 Kinesis 連接器用於下列應用程式，您必須下載連接器的原始程式碼，並依照 Apache Flink 文件所述進行建置。

建立和編譯應用程式碼

在您的開發環境中建立 Java/Maven 應用程式。如需建立應用程式的詳細資訊，請參閱您開發環境的文件：
- 建立您的第一個 Java 專案 (Eclipse Java Neon)
- 建立、執行及封裝您的第一個 Java 應用程式 (IntelliJ Idea)

將以下程式碼用於名為 StreamingJob.java 的檔案。


 
package com.amazonaws.services.kinesisanalytics;

import com.amazonaws.services.kinesisanalytics.runtime.KinesisAnalyticsRuntime;
import org.apache.flink.api.common.serialization.SimpleStringSchema;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.connectors.kinesis.FlinkKinesisConsumer;
import org.apache.flink.streaming.connectors.kinesis.FlinkKinesisProducer;
import org.apache.flink.streaming.connectors.kinesis.config.ConsumerConfigConstants;

import java.io.IOException;
import java.util.Map;
import java.util.Properties;

public class StreamingJob {

    private static final String region = "us-east-1";
    private static final String inputStreamName = "ExampleInputStream";
    private static final String outputStreamName = "ExampleOutputStream";

    private static DataStream<String> createSourceFromStaticConfig(StreamExecutionEnvironment env) {
        Properties inputProperties = new Properties();
        inputProperties.setProperty(ConsumerConfigConstants.AWS_REGION, region);
        inputProperties.setProperty(ConsumerConfigConstants.STREAM_INITIAL_POSITION, "LATEST");

        return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(), inputProperties));
    }

    private static DataStream<String> createSourceFromApplicationProperties(StreamExecutionEnvironment env)
            throws IOException {
        Map<String, Properties> applicationProperties = KinesisAnalyticsRuntime.getApplicationProperties();
        return env.addSource(new FlinkKinesisConsumer<>(inputStreamName, new SimpleStringSchema(),
                applicationProperties.get("ConsumerConfigProperties")));
    }

    private static FlinkKinesisProducer<String> createSinkFromStaticConfig() {
        Properties outputProperties = new Properties();
        outputProperties.setProperty(ConsumerConfigConstants.AWS_REGION, region);
        outputProperties.setProperty("AggregationEnabled", "false");

        FlinkKinesisProducer<String> sink = new FlinkKinesisProducer<>(new SimpleStringSchema(), outputProperties);
        sink.setDefaultStream(outputStreamName);
        sink.setDefaultPartition("0");
        return sink;
    }

    private static FlinkKinesisProducer<String> createSinkFromApplicationProperties() throws IOException {
        Map<String, Properties> applicationProperties = KinesisAnalyticsRuntime.getApplicationProperties();
        FlinkKinesisProducer<String> sink = new FlinkKinesisProducer<>(new SimpleStringSchema(),
                applicationProperties.get("ProducerConfigProperties"));

        sink.setDefaultStream(outputStreamName);
        sink.setDefaultPartition("0");
        return sink;
    }

    public static void main(String[] args) throws Exception {
        // set up the streaming execution environment
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        /*
         * if you would like to use runtime configuration properties, uncomment the
         * lines below
         * DataStream<String> input = createSourceFromApplicationProperties(env);
         */

        DataStream<String> input = createSourceFromStaticConfig(env);

        /*
         * if you would like to use runtime configuration properties, uncomment the
         * lines below
         * input.addSink(createSinkFromApplicationProperties())
         */

        input.addSink(createSinkFromStaticConfig());

        env.execute("Flink Streaming Java API Skeleton");
    }
}

請注意下列關於上述程式碼範例的事項：

此檔案包含定義應用程式功能的 main 方法。
您的應用程式會建立來源與目的地連接器，以使用 StreamExecutionEnvironment 物件來存取外部資源。
應用程式會使用靜態屬性來建立來源與目的地連接器。若要使用動態應用程式屬性，請使用 createSourceFromApplicationProperties 和 createSinkFromApplicationProperties 方法來建立連接器。這些方法會讀取應用程式的屬性，來設定連接器。

請將應用程式的程式碼編譯並封裝成 JAR 檔案，以使用應用程式的程式碼。您可以使用下列兩種方式的其中之一，編譯和封裝您的程式碼：
- 使用命令列 Maven 工具。請在包含 pom.xml 檔案的目錄中執行下列命令，來建立 JAR 檔案：
```
mvn package
```
- 設定開發環境。如需詳細資訊，請參閱您的開發環境文件。
您可以將您的套件做為 JAR 檔案上傳，或壓縮您的套件並做為 ZIP 檔案上傳。如果您使用建立應用程式 AWS CLI，您可以指定程式碼內容類型 (JAR 或 ZIP)。
如果編譯時發生錯誤，請確認您的 JAVA_HOME 環境變數是否正確設定。

如果應用程式成功編譯，則會建立下列檔案：

target/java-getting-started-1.0.jar

上傳 Apache Flink 串流 Java 程式碼

在本節中，您會建立 Amazon Simple Storage Service (Amazon S3) 儲存貯體並上傳您的應用程式的程式碼。

上傳應用程式的程式碼

開啟位於 https://console.aws.amazon.com/s3/ 的 Amazon S3 主控台。
選擇建立儲存貯體。
在儲存貯體名稱欄位中，輸入 ka-app-code-<username>。新增尾碼至儲存貯體名稱，例如您的使用者名稱，使其成為全域唯一的。選擇下一步。
在設定選項步驟中，保留原有設定並選擇 Next (下一步)。
在設定許可步驟中，保留原有設定並選擇 Next (下一步)。
選擇建立儲存貯體。
在 Amazon S3 主控台中，選擇 ka-app-code-<username> 儲存貯體，並選擇上傳。
在選取檔案步驟中，選擇新增檔案。導覽至您在上一步驟中建立的 java-getting-started-1.0.jar 檔案。選擇下一步。
在設定許可步驟中，保留原有設定。選擇下一步。
在設定屬性步驟中，保留原有設定。選擇上傳。

您的應用程式的程式碼現在儲存在您的應用程式可以存取的 Amazon S3 儲存貯體中。

建立並執行 Managed Service for Apache Flink 應用程式

您可以使用主控台或 AWS CLI建立和執行 Managed Service for Apache Flink 應用程式。

注意

當您使用主控台建立應用程式時，系統會為您建立 AWS Identity and Access Management (IAM) 和 Amazon CloudWatch Logs 資源。當您使用建立應用程式時 AWS CLI，您可以分別建立這些資源。

建立並執行應用程式（主控台）

依照以下步驟來使用主控台建立、設定、更新及執行應用程式。

建立應用程式

在以下網址開啟 Kinesis 主控台：https://console.aws.amazon.com/kinesis。
在 Amazon Kinesis 儀表板上，選擇建立分析應用程式。
在 Kinesis Analytics - Create application (Kinesis 分析 - 建立應用程式) 頁面，請如下所述提供應用程式詳細資訊：
- 在應用程式名稱中，輸入 MyApplication。
- 對於 Description (說明)，輸入 My java test app。
- 針對 Runtime (執行時間)，選擇 Apache Flink 1.6。
對於存取許可，請選擇建立/更新 IAM 角色 kinesis-analytics-MyApplication-us-west-2。
選擇 建立應用程式。

注意

當您使用主控台建立 Amazon Managed Service for Apache Flink 應用程式時，您可以選擇為您的應用程式建立 IAM 角色和政策。應用程式使用此角色和政策來存取其相依資源。這些 IAM 資源會如下所述使用您的應用程式名稱和區域命名：

政策：kinesis-analytics-service-MyApplication-us-west-2
角色：kinesis-analytics-MyApplication-us-west-2

編輯 IAM 政策

編輯 IAM 政策來新增存取 Kinesis 資料串流的許可。

前往 https://console.aws.amazon.com/iam/ 開啟 IAM 主控台。
選擇政策。選擇主控台為您在上一節所建立的 kinesis-analytics-service-MyApplication-us-west-2 政策。
在摘要頁面，選擇編輯政策。請選擇 JSON 標籤。

將下列政策範例的反白部分新增至政策。使用您的帳戶 ID 取代範例帳戶 ID (012345678901)。

設定應用程式

在我的應用程式頁面，選擇設定。
在設定應用程式頁面，提供程式碼位置：
- 對於 Amazon S3 儲存貯體，請輸入 ka-app-code-<username>。
- 對於 Amazon S3 物件的路徑，請輸入 java-getting-started-1.0.jar。
在存取應用程式資源下，對於存取許可，選擇建立/更新 IAM 角色 kinesis-analytics-MyApplication-us-west-2。
在屬性下，為群組 ID輸入 ProducerConfigProperties。

輸入以下應用程式屬性和數值：

金鑰	值
`flink.inputstream.initpos`	`LATEST`
`aws:region`	`us-west-2`
`AggregationEnabled`	`false`

在監控下，確保監控指標層級設為應用程式。
針對 CloudWatch 記錄，選取啟用核取方塊。
選擇更新。

注意

當您選擇啟用 CloudWatch 記錄時，Managed Service for Apache Flink 便會為您建立日誌群組和日誌串流。這些資源的名稱如下所示：

日誌群組：/aws/kinesis-analytics/MyApplication
日誌串流：kinesis-analytics-log-stream

執行應用程式

在 MyApplication 頁面，選擇執行。確認動作。
應用程式執行時，重新整理頁面。主控台會顯示 Application graph (應用程式圖形)。

停止應用程式

在 MyApplication 頁面，選擇停止。確認動作。

更新應用程式

您可以使用主控台更新應用程式設定，例如應用程式屬性、監控設定及位置或應用程式 JAR 的檔名。如果需要更新應用程式的程式碼，也可以從 Amazon S3 儲存貯體重新載入應用程式 JAR。

在 MyApplication 頁面，選擇設定。更新應用程式設定，然後選擇更新。

建立並執行應用程式 (AWS CLI)

在本節中，您可以使用 AWS CLI 來建立和執行 Managed Service for Apache Flink 應用程式。Managed Service for Apache Flink 使用 kinesisanalyticsv2 AWS CLI 命令來建立 Managed Service for Apache Flink 應用程式並與之互動。

建立許可政策

您會先建立具有兩條陳述式的許可政策：一條陳述式授與來源串流上 read 動作的許可，而另一條則是授與目的地串流上 write 動作的許可。您之後會將政策連接至 IAM 角色 (您會在下一節中建立)。因此，當 Managed Service for Apache Flink 擔任角色時，服務便具有從來源串流讀取並寫入目的地串流的所需許可。

使用以下程式碼來建立 KAReadSourceStreamWriteSinkStream 許可政策。以您用於建立 Amazon S3 儲存貯體 (以儲存應用程式的程式碼) 的使用者名稱來取代 username。使用您的帳戶 ID 取代 Amazon Resource Name (ARN) (012345678901) 中的帳戶 ID。

如需建立許可政策的逐步指示，請參閱《IAM 使用者指南》中的教學課程：建立和連接您的第一個客戶管理政策。

注意

若要存取其他 AWS 服務，您可以使用適用於 Java 的 AWS SDK。Managed Service for Apache Flink 自動將 SDK 所需的憑證設定為與應用程式相關聯的服務執行 IAM 角色。無須採取額外的步驟。

建立 IAM 角色

在本節中，您會建立 Managed Service for Apache Flink 可擔任的 IAM 角色，以讀取來源串流並寫入目的地串流。

Managed Service for Apache Flink 沒有許可，無法存取串流。您可以透過 IAM 角色來授與這些許可。各 IAM 角色都有連接兩項政策。信任政策會授與擔任角色的 Managed Service for Apache Flink 許可，而許可政策決定了 Managed Service for Apache Flink 在擔任角色後可以執行的作業。

您會將在上一節中建立的許可政策連接至此角色。

若要建立一個 IAM 角色

前往網址 https://console.aws.amazon.com/iam/ 開啟 IAM 主控台。
在導覽窗格中，選擇角色、建立角色。
在選取可信身分類型下，選擇 AWS 服務。在選擇將使用此角色的服務下，選擇 Kinesis。在 Select your use case (選取您的使用案例) 下，選擇 Kinesis Analytics (Kinesis 分析)。

選擇下一步：許可。
在連接許可政策頁面，選擇下一步：檢閱。您會在建立角色後連接許可政策。
在建立角色頁面，輸入 KA-stream-rw-role 作為角色名稱。選擇建立角色。

現在您已建立新的 IAM 角色，名為 KA-stream-rw-role。您接著會更新角色的信任和許可政策。
將許可政策連接到角色。

注意
在此練習中，Managed Service for Apache Flink 擔任從 Kinesis 資料串流 (來源) 讀取資料並將輸出寫入另一個 Kinesis 資料串流的角色。因此您會連接在上一個步驟中建立的政策，建立許可政策。
1. 在摘要頁面，選擇許可標籤。
2. 選擇連接政策。
3. 在搜尋方塊中，輸入 KAReadSourceStreamWriteSinkStream (您在上一節中建立的政策)。
4. 選擇 KAReadInputStreamWriteOutputStream 政策，然後選擇 Attach policy (連接政策)。

您現在已建立應用程式用於存取資源的服務執行角色。請記下新角色的 ARN。

如需建立角色的逐步說明，請參閱《IAM 使用者指南》中的建立 IAM 角色 (主控台)。

建立 Managed Service for Apache Flink 應用程式

將下列 JSON 程式碼複製到名為 create_request.json 的檔案。使用您之前建立之角色的 ARN，取代範例角色 ARN。使用您在上一節中選擇的尾碼取代儲存貯體 ARN 尾碼 (username)。使用您的帳戶 ID 取代服務執行角色中的範例帳戶 ID (012345678901)。


{
    "ApplicationName": "test",
    "ApplicationDescription": "my java test app",
    "RuntimeEnvironment": "FLINK-1_6",
    "ServiceExecutionRole": "arn:aws:iam::012345678901:role/KA-stream-rw-role",
    "ApplicationConfiguration": {
        "ApplicationCodeConfiguration": {
            "CodeContent": {
                "S3ContentLocation": {
                    "BucketARN": "arn:aws:s3:::ka-app-code-username",
                    "FileKey": "java-getting-started-1.0.jar"
                }
            },
            "CodeContentType": "ZIPFILE"
        },
        "EnvironmentProperties":  { 
         "PropertyGroups": [ 
            { 
               "PropertyGroupId": "ProducerConfigProperties",
               "PropertyMap" : {
                    "flink.stream.initpos" : "LATEST",
                    "aws.region" : "us-west-2",
                    "AggregationEnabled" : "false"
               }
            },
            { 
               "PropertyGroupId": "ConsumerConfigProperties",
               "PropertyMap" : {
                    "aws.region" : "us-west-2"
               }
            }
         ]
      }
    }
}

使用前述請求執行 CreateApplication 動作以建立應用程式：


aws kinesisanalyticsv2 create-application --cli-input-json file://create_request.json

應用程式現在已建立。您會在下一個步驟中啟動應用程式。

啟動應用程式

在本節中，您會透過 StartApplication 動作來啟動應用程式。

啟動應用程式

將下列 JSON 程式碼複製到名為 start_request.json 的檔案。


{
    "ApplicationName": "test",
    "RunConfiguration": {
        "ApplicationRestoreConfiguration": { 
         "ApplicationRestoreType": "RESTORE_FROM_LATEST_SNAPSHOT"
         }
    }
}

以啟動應用程式的上述請求，執行 StartApplication 動作：


aws kinesisanalyticsv2 start-application --cli-input-json file://start_request.json

應用程式現在正在執行。您可以在 Amazon CloudWatch 主控台上查看 Managed Service for Apache Flink 指標，以確認應用程式是否正常運作。

停止應用程式

在本節，您會使用該 StopApplication 動作來停止應用程式。

停止應用程式

將下列 JSON 程式碼複製到名為 stop_request.json 的檔案。
```
{"ApplicationName": "test"
}
```

以停止應用程式的上述請求，執行 StopApplication 動作：


aws kinesisanalyticsv2 stop-application --cli-input-json file://stop_request.json

現在已停止應用程式。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

步驟 2：設定 AWS CLI

教學課程： AWS Lambda 搭配 Amazon Kinesis Data Streams 使用

建立並執行 Managed Service for Apache Flink 應用程式

本節包含下列步驟：

建立兩個 Amazon Kinesis 資料串流

建立資料串流 (AWS CLI)

寫入範例記錄至輸入串流

注意

下載並檢查 Apache Flink 串流 Java 程式碼

編譯應用程式程式碼

注意

建立和編譯應用程式碼

上傳 Apache Flink 串流 Java 程式碼

上傳應用程式的程式碼

建立並執行 Managed Service for Apache Flink 應用程式

注意

主題

建立並執行應用程式 （主控台）

建立應用程式

注意

編輯 IAM 政策

設定應用程式

注意

執行應用程式

停止應用程式

更新應用程式

建立並執行應用程式 (AWS CLI)

建立許可政策

注意

建立 IAM 角色

若要建立一個 IAM 角色

注意

建立 Managed Service for Apache Flink 應用程式

啟動應用程式

啟動應用程式

停止應用程式

停止應用程式

建立並執行應用程式（主控台）