Configurar Python para uso com o AWS Glue - AWS Glue

Configurar Python para uso com o AWS Glue

Use o Python para desenvolver seus scripts de ETL para trabalhos do Spark. As versões do Python compatíveis para trabalhos de ETL dependem da versão do AWS Glue do trabalho. Para obter mais informações sobre versões do AWS Glue, consulte Glue version job property.

Para configurar o sistema para usar o Python com o AWS Glue

Siga estas etapas para instalar o Python e invocar as APIs do AWS Glue.

  1. Se você ainda não tem o Python instalado, faça download dele e instale-o acessando a página de download Python.org.

  2. Instale a AWS Command Line Interface (AWS CLI) conforme descrito na Documentação da AWS CLI.

    A AWS CLI não é necessária para usar o Python. No entanto, instalar e configurar a CLI é uma maneira conveniente de configurar a AWS com as credenciais da sua conta e verificar se elas funcionam.

  3. Instale o AWS SDK for Python (Boto 3), conforme descrito no Guia de início rápido do Boto3.

    As APIs de recursos do Boto 3 ainda não estão disponíveis no AWS Glue. Atualmente, apenas as APIs de cliente do Boto 3 podem ser usadas.

    Para obter mais informações sobre o Boto 3, consulte Conceitos básicos do AWS SDK for Python (Boto3).

É possível encontrar exemplos de código Python e utilitários para o AWS Glue no repositório de exemplos do AWS Glue no site do GitHub.