Creazione di un notebook Studio - Servizio gestito per Apache Flink

Il servizio gestito da Amazon per Apache Flink era precedentemente noto come Analisi dei dati Amazon Kinesis per Apache Flink.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di un notebook Studio

Un notebook Studio contiene query o programmi scritti in SQL, Python o Scala che vengono eseguiti su dati di streaming e restituiscono risultati analitici. Puoi creare la tua applicazione utilizzando la console o la CLI e fornire query per l'analisi dei dati dalla tua origine dati.

L'applicazione ha i seguenti componenti:

  • Un'origine dati, ad esempio un cluster Amazon MSK, un flusso di dati Kinesis o un bucket Amazon S3.

  • AWS Glue Un database. Questo database contiene tabelle in cui sono archiviati gli schemi e gli endpoint di origine e destinazione dei dati. Per ulteriori informazioni, consulta Lavorare con AWS Glue.

  • Il tuo codice dell'applicazione. Il codice implementa la tua query o il tuo programma di analisi.

  • Le impostazioni dell'applicazione e le proprietà di runtime. Per informazioni sulle impostazioni dell'applicazione e le proprietà di runtime, consulta i seguenti argomenti nella Guida per gli sviluppatori di applicazioni Apache Flink:

    • Parallelismo e dimensionamento delle applicazioni: l'impostazione Parallelismo dell'applicazione serve per controllare il numero di query che l'applicazione può eseguire contemporaneamente. Le query possono inoltre trarre vantaggio da un aumento del parallelismo se hanno più percorsi di esecuzione, ad esempio nelle seguenti circostanze:

      • Durante l'elaborazione di più partizioni di un flusso di dati Kinesis

      • Durante il partizionamento dei dati utilizzando l'operatore KeyBy.

      • Quando si utilizzano più operatori finestra

      Per ulteriori informazioni sul dimensionamento dell'applicazione, consulta Dimensionamento delle applicazioni nel servizio gestito per Apache Flink.

    • Registrazione e monitoraggio: per informazioni sulla registrazione e il monitoraggio delle applicazioni, consulta Registrazione e monitoraggio nel servizio gestito da Amazon per Apache Flink.

    • La tua applicazione utilizza checkpoint e savepoint per la tolleranza agli errori. I checkpoint e i savepoint non sono abilitati per impostazione predefinita per i notebook Studio.

Puoi creare il tuo taccuino Studio utilizzando AWS Management Console o AWS CLI.

Quando crei l'applicazione dalla console, hai a disposizione le seguenti opzioni:

  • Nella console Amazon MSK, scegli un cluster, quindi scegli Elabora dati in tempo reale.

  • Nella console del flusso di dati Kinesis, scegli un flusso di dati, quindi nella scheda Applicazioni scegli Elabora dati in tempo reale.

  • Nella console del servizio gestito per Apache Flink, scegli la scheda Studio, quindi scegli Crea notebook Studio.

Per un tutorial, consulta Rilevamento degli eventi con il servizio gestito per Apache Flink.

Per un esempio di una soluzione notebook Studio più avanzata, consulta Apache Flink sul servizio gestito da Amazon per Apache Flink Studio.