As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Diferentes maneiras de colocar dados na Amazon EMR
EMRA Amazon fornece várias maneiras de colocar dados em um cluster. A forma mais comum é fazer o upload dos dados para o Amazon S3 e usar os recursos integrados da Amazon EMR para carregar os dados no seu cluster. Você também pode usar o DistributedCache recurso do Hadoop para transferir arquivos de um sistema de arquivos distribuído para o sistema de arquivos local. A implementação do Hive fornecida pela Amazon EMR (Hive versão 0.7.1.1 e posterior) inclui funcionalidades que você pode usar para importar e exportar dados entre o DynamoDB e um cluster da Amazon. EMR Se tiver grandes quantidades de dados on-premises para processar, talvez considere o serviço AWS Direct Connect útil.
Tópicos
- Carregar dados no Amazon S3
- Carregar dados usando o AWS DataSync
- Importe arquivos com cache distribuído com a Amazon EMR
- Detectando e processando arquivos compactados com a Amazon EMR
- Importe dados do DynamoDB para o Hive com a Amazon EMR
- Conecte-se aos dados com AWS Direct Connect a Amazon EMR
- Faça upload de grandes quantidades de dados para a Amazon EMR com AWS Snowball