Preguntas frecuentes sobre AWS Glue ETL sin servidor - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Preguntas frecuentes sobre AWS Glue ETL sin servidor

En esta sección, se brindan respuestas a las preguntas frecuentes sobre ETL sin servidor en AWS Glue.

¿Cuándo debo usar el shell de Python en lugar de Apache Spark para los AWS Glue trabajos?

Use el shell de Python cuando tenga trabajos ETL básicos o conjuntos de datos pequeños que no requieran las capacidades de computación distribuida de Apache Spark. Utilice Apache Spark para tareas de ETL más complejas o conjuntos de datos de gran tamaño que requieran la alta potencia de procesamiento para la que está optimizado Spark.

¿Cuál es la AWS Glue versión recomendada para mi proyecto?

Por lo general, recomendamos utilizar la última versión de AWS Glue. La página de AWS Glue versiones enumera las diferencias entre las versiones, junto con su compatibilidad con varias versiones de Python y Spark.