Perguntas frequentes sobre ETL sem servidor AWS Glue - AWS Orientação prescritiva

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Perguntas frequentes sobre ETL sem servidor AWS Glue

Esta seção fornece respostas para perguntas comuns sobre a ETL tecnologia sem servidor no AWS Glue.

Quando devo usar o shell do Python em vez do Apache Spark para trabalhos? AWS Glue

Use o shell do Python quando tiver trabalhos básicos de ETL ou pequenos conjuntos de dados que não exijam os recursos de computação distribuída do Apache Spark. Use o Apache Spark para tarefas ETL mais complexas ou grandes conjuntos de dados que exigem o alto poder de processamento para o qual o Spark é otimizado.

Qual é a AWS Glue versão recomendada para meu projeto?

Geralmente, recomendamos usar a versão mais recente do AWS Glue. A página de AWS Glue versões lista as diferenças entre as versões, juntamente com sua compatibilidade com várias versões do Python e do Spark.