Guida introduttiva ad Amazon Managed Service per Apache Flink for Python - Servizio gestito per Apache Flink

Il servizio gestito da Amazon per Apache Flink era precedentemente noto come Analisi dei dati Amazon Kinesis per Apache Flink.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Guida introduttiva ad Amazon Managed Service per Apache Flink for Python

Questa sezione presenta i concetti fondamentali di un servizio gestito per Apache Flink utilizzando Python e l'API Table. Descrive le opzioni disponibili per la creazione e il test delle applicazioni. Fornisce inoltre istruzioni per l'installazione degli strumenti necessari per completare i tutorial di questa guida e creare la tua prima applicazione.

Nozioni di base su Pyflink: l'interprete Python per Apache | Amazon Web Services

Prima di iniziare, ti invitiamo a guardare il video seguente:

Componenti di un'applicazione Managed Service per Apache Flink

Per elaborare i dati, l'applicazione del servizio per Apache Flink utilizza un'applicazione Python che elabora l'input e produce l'output utilizzando il runtime di Apache Flink.

L'applicazione del servizio gestito per Apache Flink include i componenti riportati di seguito:

  • Proprietà di runtime: è possibile utilizzare le proprietà di runtime per configurare l'applicazione senza ricompilare il codice dell'applicazione.

  • Origine della tabella: l'applicazione consuma dati utilizzando un'origine. Un connettore di origine legge i dati da un flusso di dati Kinesis, da un argomento Amazon MSK o simili. Per ulteriori informazioni, consulta Sorgenti API per tabelle.

  • Funzioni: l'applicazione elabora i dati utilizzando una o più funzioni. Una funzione può trasformare, arricchire o aggregare dati.

  • Sink: l'applicazione produce dati verso origini esterne utilizzando i sink. Un connettore sink scrive i dati su un flusso di dati Kinesis, un flusso Firehose Firehose, un argomento Amazon MSK, un bucket Amazon S3 e così via. Per ulteriori informazioni, consulta Table API sink.

Dopo aver creato e includere in un pacchetto il codice dell'applicazione, carica il pacchetto di codice in un bucket Amazon S3. Puoi quindi creare un'applicazione del servizio gestito per Apache Flink. Inserisci la posizione del pacchetto di codice, un'origine dati di streaming e in genere una posizione di streaming o di file che riceve i dati elaborati dall'applicazione.

Prerequisiti

Prima di iniziare questo tutorial, completa le prime due fasi di Guida introduttiva ad Amazon Managed Service per Apache Flink (DataStreamAPI):

Per iniziare, consulta Crea un'applicazione.