Apache Flink - Amazon EMR

Apache Flink

Apache Flink 是一種串流資料流程引擎,可用來在高輸送量的資料來源上執行即時串流處理。Flink 可支援亂序排列事件的事件時間語意、僅此一次的語意和背壓控制,還有針對同時撰寫串流和批次應用程式進行優化的 API。

此外 Flink 也提供適用於第三方資料來源的連接器,例如以下各項:

Amazon EMR 支援將 Flink 作為 YARN 應用程式使用,因此可在叢集內與其他應用程式一起管理資源。Flink-on-YARN 可讓使用者提交暫時性的 Flink 任務,也可以建立長時間執行的叢集,用來接受多項任務,並根據 YARN 整體保留的情況來分配資源。

Flink 包含於 Amazon EMR 發行版本 5.1.0 及更新版本。

注意

Amazon EMR 發行版本 5.2.1 新增了對 FlinkKinesisConsumer 類別的支援。

下表列出 Amazon EMR 6.x 系列最新版本中包含的 Flink 版本,以及 Amazon EMR 隨 Flink 一起安裝的元件。

如需此版本中隨 Flink 一起安裝的元件版本,請參閱發行版本 6.14.0 元件版本

emr-6.14.0 的 Flink 版本資訊
Amazon EMR 版本標籤 Flink 版本 隨 Flink 一起安裝的元件

emr-6.14.0

Flink 1.17.1-amzn-0

emrfs, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, flink-client, flink-jobmanager-config, hudi, delta-standalone-connectors

下表列出 Amazon EMR 5.x 系列最新版本中包含的 Flink 版本,以及 Amazon EMR 隨 Flink 一起安裝的元件。

如需此版本中隨 Flink 一起安裝的元件版本,請參閱發行版本 6.14.0 元件版本

emr-5.36.1 的 Flink 版本資訊
Amazon EMR 版本標籤 Flink 版本 隨 Flink 一起安裝的元件

emr-5.36.1

Flink 1.14.2

emrfs, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, flink-client, flink-jobmanager-config