Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Usa Apache Spark in Amazon Athena
Amazon Athena facilita l'esecuzione di analisi e l'esplorazione dei dati in modo interattivo mediante Apache Spark senza la necessità di pianificare, configurare o gestire le risorse. Eseguire le applicazioni Apache Spark su Athena significa inviare il codice Spark per l'elaborazione e ricevere direttamente i risultati senza la necessità di configurazioni aggiuntive. Puoi utilizzare l'esperienza notebook semplificata nella console Amazon Athena per sviluppare applicazioni Apache Spark utilizzando Python o notebook Athena. APIs Apache Spark su Amazon Athena è serverless e offre il dimensionamento automatico e on demand per l'elaborazione istantanea, in modo da far fronte ai cambiamenti dei volumi di dati e dei requisiti di elaborazione.
Amazon Athena offre le seguenti funzionalità:
-
Utilizzo della console: invia le tue applicazioni Spark dalla console Amazon Athena.
-
Scripting: crea ed esegui il debug di applicazioni Apache Spark in Python in modo rapido e interattivo.
-
Dimensionamento dinamico: Amazon Athena determina automaticamente le risorse di elaborazione e memoria necessarie per eseguire un processo e dimensiona continuamente tali risorse di conseguenza fino ai massimi specificati. Questo dimensionamento dinamico riduce i costi senza influire sulla velocità.
-
Esperienza del notebook: utilizza l'editor notebook Athena per creare, modificare ed eseguire calcoli utilizzando un'interfaccia familiare. I notebook Athena sono compatibili con i notebook Jupyter e contengono un elenco di celle che vengono eseguite in ordine sotto forma di calcoli. Il contenuto delle celle può includere codice, testo, Markdown, matematica, grafici e rich media.
Per ulteriori informazioni, consulta Esegui Spark SQL su Amazon Athena
Argomenti
- Considerazioni e limitazioni
- Inizia a usare
- Gestione dei file del taccuino
- Editor di notebook
- Formati di tabella non Hive
- Supporto delle librerie Python
- Specificare una configurazione personalizzata
- Formati di dati e archiviazione supportati
- Monitora i calcoli di Apache Spark
- Abilita i bucket con pagamento da parte del richiedente
- Abilita la crittografia Spark
- Accesso al catalogo multi-account
- Quote del servizio
- Taccuino Athena APIs
- Risoluzione dei problemi