Execute uma análise interativa dos dados de streaming - Managed Service for Apache Flink

Anteriormente, o Amazon Managed Service for Apache Flink era conhecido como Amazon Kinesis Data Analytics for Apache Flink.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Execute uma análise interativa dos dados de streaming

Você usa um notebook com tecnologia sem servidor e com tecnologia Apache Zeppelin para interagir com seus dados de streaming. Seu notebook pode ter várias notas, e cada nota pode ter um ou mais parágrafos onde você pode escrever seu código.

O exemplo de SQL consulta a seguir mostra como recuperar dados de uma fonte de dados:

%flink.ssql(type=update) select * from stock;

Para obter mais exemplos de SQL consultas do Flink Streaming, consulte a Exemplos e tutoriais para notebooks Studio no Managed Service for Apache Flink seguir e as consultas na documentação do Apache Flink.

Você pode usar SQL as consultas do Flink no notebook Studio para consultar dados de streaming. Você também pode usar Python (TabelaAPI) e Scala (Tabela e DatastreamAPIs) para escrever programas para consultar seus dados de streaming de forma interativa. Você pode visualizar os resultados de suas consultas ou programas, atualizá-los em segundos e executá-los novamente para ver os resultados atualizados.

Intérpretes Flink

Você especifica qual linguagem o Managed Service for Apache Flink usa para executar seu aplicativo usando um intérprete. Você pode usar os seguintes intérpretes com o Managed Service for Apache Flink:

Nome Classe Descrição
%flink FlinkInterpreter Cria ExecutionEnvironment/StreamExecutionEnvironment/BatchTableEnvironment/StreamTableEnvironment e fornece um ambiente Scala
%flink.pyflink PyFlinkInterpreter Fornece um ambiente python
%flink.ipyflink IPyFlinkInterpreter Fornece um ambiente ipython
%flink.ssql FlinkStreamSqlInterpreter Fornece um ambiente stream sql
%flink.bsql FlinkBatchSqlInterpreter Fornece um ambiente sql em lote

Para obter mais informações sobre intérpretes Flink, consulte Interpretador Flink for Apache Zeppelin.

Se você estiver usando %flink.pyflink ou %flink.ipyflink como intérpretes, precisará usar o ZeppelinContext para visualizar os resultados no caderno.

Para exemplos mais PyFlink específicos, consulte Consulte seus fluxos de dados de forma interativa usando o Managed Service para Apache Flink Studio e Python.

Variáveis de ambiente da tabela Apache Flink

O Apache Zeppelin fornece acesso aos recursos do ambiente de tabela usando variáveis de ambiente.

Você acessa os recursos do ambiente de tabela Scala com as seguintes variáveis:

Variável Recurso
senvStreamExecutionEnvironment
stenvStreamTableEnvironment for blink planner

Você acessa os recursos do ambiente de tabela Python com as seguintes variáveis:

Variável Recurso
s_envStreamExecutionEnvironment
st_envStreamTableEnvironment for blink planner

Para obter mais informações sobre o uso de ambientes de tabela, consulte Concepts and Common API na documentação do Apache Flink.