Apache Flink - Amazon EMR

Apache Flink

O Apache Flink é um mecanismo de fluxo de dados de streaming que você pode usar para executar o processamento de streaming em tempo real em fontes de dados de alto throughput. O Flink é compatível com semântica do horário do evento para eventos fora de ordem, semântica exatamente uma vez, controle de pressão contrária e APIs otimizadas para criar aplicações de transmissão e em lotes.

Além disso, o Flink tem conectores para fontes de dados de terceiros, como o seguinte:

O Amazon EMR oferece suporte ao Flink como uma aplicação YARN, para que você possa gerenciar recursos juntamente com outras aplicações em um cluster. O Flink no YARN permite que você envie trabalhos do Flink transitórios ou você pode criar um cluster de execução prolongada que aceite vários trabalhos e aloque recursos de acordo com a reserva geral do YARN.

O Flink é incluído nas versões 5.1.0 e posteriores do Amazon EMR.

nota

O suporte para a classe FlinkKinesisConsumer foi adicionado no Amazon EMR versão 5.2.1.

A tabela a seguir lista a versão do Flink incluída na versão mais recente da série 6.x do Amazon EMR, além dos componentes que o Amazon EMR instala com o Flink.

Para obter a versão dos componentes instalados com o Flink nessa versão, consulte Versões dos componentes da versão 6.14.0.

Informações de versão do Flink para o emr-6.14.0
Rótulo de versão do Amazon EMR Versão do Flink Componentes instalados com o Flink

emr-6.14.0

Flink 1.17.1-amzn-0

emrfs, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, flink-client, flink-jobmanager-config, hudi, delta-standalone-connectors

A tabela a seguir lista a versão do Flink incluída na versão mais recente da série 5.x do Amazon EMR, além dos componentes que o Amazon EMR instala com o Flink.

Para obter a versão dos componentes instalados com o Flink nessa versão, consulte Versões dos componentes da versão 6.14.0.

Informações de versão do Flink para o emr-5.36.1
Rótulo de versão do Amazon EMR Versão do Flink Componentes instalados com o Flink

emr-5.36.1

Flink 1.14.2

emrfs, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, flink-client, flink-jobmanager-config