Apache Flink - Amazon EMR

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Apache Flink

Apache Flink 是一个流式处理数据流引擎,您可以使用此引擎在高吞吐量数据源上轻松运行实时流处理。Flink 支持事件的事件时间语义、exactly-once 语义、背压控制,并针对编写流式和批处理应用程序APIs进行了优化。 out-of-order

此外,Flink 具有适用于第三方数据源的连接器,例如以下内容:

Amazon EMR 支持 Flink 作为YARN应用程序,因此您可以管理集群中的资源以及其他应用程序。Flink-on-YARN 允许您提交临时的 Flink 作业,或者您可以创建一个长时间运行的集群,该集群接受多个任务并根据总体预留量分配资源。YARN

Flink 包含在亚马逊EMR发行版 5.1.0 及更高版本中。

注意

亚马逊EMR发行版 5.2.1 中增加了对该FlinkKinesisConsumer类的支持。

下表列出了最新版本的亚马逊 EMR 7.x 系列中包含的 Flink 版本,以及亚马逊与 Flink 一起EMR安装的组件。

有关此版本中与 Flink 一起安装的组件的版本,请参阅 7.2.0 版本的组件版本。

emr-7.2.0 的 Flink 版本信息
亚马逊EMR发行标签 Flink 版本 随 Flink 安装的组件

emr-7.2.0

Flink 1.18.1

emrfs, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, flink-client, flink-jobmanager-config, hudi, delta

下表列出了最新版本的亚马逊 EMR 6.x 系列中包含的 Flink 版本,以及亚马逊与 Flink 一起EMR安装的组件。

有关此发行版中随 Flink 安装的组件版本,请参阅发行版 6.15.0 组件版本

emr-6.15.0 的 Flink 版本信息
亚马逊EMR发行标签 Flink 版本 随 Flink 安装的组件

emr-6.15.0

Flink 1.17.1

emrfs, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, flink-client, flink-jobmanager-config, hudi, delta-standalone-connectors

下表列出了最新版本的亚马逊 EMR 5.x 系列中包含的 Flink 版本,以及亚马逊与 Flink 一起EMR安装的组件。

有关此版本中与 Flink 一起安装的组件的版本,请参阅 5.36.2 版本的组件版本。

emr-5.36.2 的 Flink 版本信息
亚马逊EMR发行标签 Flink 版本 随 Flink 安装的组件

emr-5.36.2

Flink 1.14.2

emrfs, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, flink-client, flink-jobmanager-config