As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Como selecionar a ferramenta certa para fazer upload ou migrar dados em massa para o Amazon Keyspaces
Nesta seção, você pode analisar as diferentes ferramentas que você pode usar para carregar ou migrar dados em massa para o Amazon Keyspaces e aprender como selecionar a ferramenta correta com base em suas necessidades. Além disso, esta seção fornece uma visão geral e casos de uso dos step-by-step tutoriais disponíveis que demonstram como importar dados para o Amazon Keyspaces.
Para analisar as estratégias disponíveis para migrar workloads do Apache Cassandra para o Amazon Keyspaces, consulte Crie um plano de migração para migrar do Apache Cassandra para o Amazon Keyspaces.
-
Ferramentas de migração
Com a calculadora de preços do Amazon Keyspaces (para Apache Cassandra)
disponível no Github, você pode estimar seus custos mensais do Amazon Keyspaces com base na sua carga de trabalho atual do Apache Cassandra. Insira métricas da saída de status do nodetool do Cassandra e da configuração sem servidor pretendida para o Amazon Keyspaces para comparar os custos diretos entre as duas soluções. Observe que essa calculadora se concentra apenas nos custos operacionais do Amazon Keyspaces em comparação com sua implantação atual do Cassandra. Não inclui fatores de custo total de propriedade (TCO), como manutenção da infraestrutura, sobrecarga operacional ou custos de suporte para o Cassandra. Proxy ZDM Dual Write para migração do Amazon Keyspaces — O ZDM Dual Write Proxy disponível no Github
oferece suporte à migração sem tempo de inatividade do Apache Cassandra para o Amazon Keyspaces. CQLReplicator— CQLReplicator é um utilitário de código aberto disponível no Github
que ajuda você a migrar dados do Apache Cassandra para o Amazon Keyspaces quase em tempo real. Para obter mais informações, consulte Migre dados usando CQLReplicator.
Para saber mais sobre como usar o Amazon Managed Streaming for Apache Kafka para implementar um processo de migração on-line com gravação dupla, consulte Guidance for continuous data migration from Apache Cassandra to Amazon Keyspaces
. Para grandes migrações, considere usar uma ferramenta de extração, transformação e carregamento (ETL). Você pode usar AWS Glue para realizar migrações de transformação de dados de forma rápida e eficaz. Para obter mais informações, consulte Processo de migração off-line: Apache Cassandra para Amazon Keyspaces.
Para saber como usar o conector Apache Cassandra do Spark para gravar dados no Amazon Keyspaces, consulte Tutorial: Integre com o Apache Spark para importar ou exportar dados.
Comece rapidamente a carregar dados no Amazon Keyspaces usando o comando cqlsh
COPY FROM
. O cqlsh está incluído no Apache Cassandra e é mais adequado para carregar pequenos conjuntos de dados ou dados de teste. Para step-by-step obter instruções, consulteTutorial: Como carregar dados no Amazon Keyspaces usando cqlsh.Você também pode usar o DataStax Bulk Loader for Apache Cassandra para carregar dados no Amazon Keyspaces usando o comando.
dsbulk
DSBulkfornece recursos de importação mais robustos do que o cqlsh e está disponível no GitHub repositório.Para step-by-step obter instruções, consulteTutorial: Carregando dados no Amazon Keyspaces usando DSBulk.
Considerações gerais sobre uploads de dados para o Amazon Keyspaces
-
Divida o upload de dados em componentes menores.
Considere as seguintes unidades de migração e sua presença potencial em termos de tamanho de dados brutos. O upload de quantidades menores de dados em uma ou mais fases pode ajudar a simplificar sua migração.
Por cluster: migre todos os seus dados do Cassandra de uma só vez. Essa abordagem pode ser adequada para clusters menores.
-
Por espaço de chaves ou tabela: divida sua migração em grupos de espaços de chaves ou tabelas. Essa abordagem pode ajudá-lo a migrar dados em fases com base nos requisitos de cada workload.
Por dados: considere migrar dados para um grupo específico de usuários ou produtos, para reduzir ainda mais o tamanho dos dados.
-
Priorize quais dados carregar primeiro com base na simplicidade.
Considere se você tem dados que poderiam ser migrados primeiro com mais facilidade – por exemplo, dados que não mudam em horários específicos, dados de trabalhos em lotes noturnos, dados não usados em horários off-line ou dados de aplicativos internos.