Como inserir dados no Amazon EMR - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Como inserir dados no Amazon EMR

O Amazon EMR fornece várias maneiras de colocar dados em um cluster. A mais comum é carregar os dados para o Amazon S3 e usar os recursos internos do Amazon EMR para carregar os dados no cluster. Você também pode usar o recurso DistributedCache do Hadoop para transferir arquivos de um sistema de arquivos distribuído para o sistema de arquivos local. A implementação do Hive fornecida pelo Amazon EMR (Hive versão 0.7.1.1 e posteriores) inclui a funcionalidade que você pode usar para importar e exportar dados entre o DynamoDB e um cluster do Amazon EMR. Se tiver grandes quantidades de dados on-premises para processar, talvez considere o serviço AWS Direct Connect útil.