Utiliser Apache Spark dans Amazon Athena

Amazon Athena facilite l'exécution interactive de l'analyse et de l'exploration des données à l'aide d'Apache Spark sans qu'il soit nécessaire de planifier, de configurer ou de gérer les ressources. Exécuter des applications Apache Spark sur Athena signifie soumettre du code Spark pour traitement et recevoir directement les résultats sans avoir besoin de configuration supplémentaire. Vous pouvez utiliser l'expérience de bloc-notes simplifiée de la console Amazon Athena pour développer des applications Apache Spark à l'aide de Python ou d'Athena Notebook. APIs Apache Spark fonctionne sur Amazon Athena sans serveur et offre une mise à l'échelle automatique et à la demande qui permet d'obtenir un calcul instantané pour répondre à l'évolution des volumes de données et des exigences de traitement.

Amazon Athena offre les fonctionnalités suivantes :

Utilisation de la console – Soumettez vos applications Spark à partir de la console Amazon Athena.
Création de scripts – Créez et déboguez rapidement et de manière interactive des applications Apache Spark en Python.
Dimensionnement dynamique – Amazon Athena détermine automatiquement les ressources de calcul et de mémoire nécessaires à l'exécution d'une tâche et adapte en permanence ces ressources en conséquence jusqu'aux maximums que vous spécifiez. Ce dimensionnement dynamique réduit le coût sans affecter la vitesse.
Expérience avec les blocs-notes – Utilisez l'éditeur de bloc-notes Athena pour créer, modifier et exécuter des calculs à l'aide d'une interface familière. Les blocs-notes Athena sont compatibles avec les blocs-notes Jupyter et contiennent une liste de cellules qui sont exécutées dans l'ordre sous forme de calculs. Le contenu des cellules peut inclure du code, du texte, du Markdown, des mathématiques, des diagrammes et des médias enrichis.

Pour plus d'informations, consultez les sections Exécuter Spark SQL sur Amazon Athena Spark et Explorez votre lac de données à l'aide d'Amazon Athena pour Apache Spark sur AWS le blog Big Data.

Rubriques

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Listage des requêtes nommées

Considérations et restrictions