Amazon Keyspaces 로 마이그레이션 - Amazon Keyspaces(Apache Cassandra용)

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon Keyspaces 로 마이그레이션

Amazon Keyspaces (Apache Cassandra용) 는 고가용성의 확장 가능한 관리형 Apache Cassandra 호환 데이터베이스 서비스입니다. 이 단원에서 설명하는 단계를 사용하여 온프레미스 또는 Amazon Elastic Compute Cloud (Amazon EC2) 에서 실행되는 Cassandra 데이터베이스에서 Amazon Keyspaces 로 데이터를 마이그레이션할 수 있습니다.

마이그레이션이 성공적인지 확인하려면 다음 모범 사례를 따르는 것이 좋습니다.

  • 마이그레이션을 더 작은 구성 요소로 나눕니다.

    원시 데이터 크기 측면에서 다음과 같은 마이그레이션 단위와 잠재적 설치 공간을 고려합니다. 하나 이상의 단계에서 적은 양의 데이터를 마이그레이션하면 마이그레이션을 간소화하는 데 도움이 될 수 있습니다.

    클러스터별— 모든 카산드라 데이터를 한 번에 마이그레이션할 수 있습니다. 이 방법은 소규모 클러스터의 경우 괜찮을 수 있습니다.

    키스페이스 또는 테이블별— 마이그레이션을 키스페이스 또는 테이블 그룹으로 나눕니다. 이 접근 방식은 각 워크로드에 대한 요구 사항에 따라 단계적으로 데이터를 마이그레이션하는 데 도움이 될 수 있습니다.

    데이터별— 특정 사용자 또는 제품 그룹의 데이터를 마이그레이션하여 데이터 크기를 훨씬 줄일 수 있습니다.

  • 단순성에 따라 먼저 마이그레이션할 데이터의 우선 순위를 지정합니다.

    특정 시간 동안 변경되지 않는 데이터, 야간 배치 작업의 데이터, 오프라인 시간 동안 사용되지 않는 데이터 또는 내부 앱의 데이터 등 먼저 마이그레이션할 수 있는 데이터가 있는지 생각해 보십시오.

  • 특정 툴링을 사용합니다.

    • cqlsh를 사용하여 Amazon 키스페이스로 데이터를 로드하는 작업을 빠르게 시작하십시오.COPY FROMcommand.cqlsh는 아파치 카산드라에 포함되어 있으며 작은 데이터 세트 또는 테스트 데이터를 로드하는 데 가장 적합합니다. 용 step-by-step 지침, 단원을 참조하십시오자습서: cqlsh를 사용하여 Amazon Keyspaces 로 데이터 로드.

    • 대규모 데이터 세트가 있는 프로덕션 워크로드의 경우 DataStax 아파치 카산드라의 대량 로더는 다음을 사용하여 Amazon Keyspaces 스페이스에 데이터를 로드합니다.dsbulk명령. DSBulk는 보다 강력한 가져오기 기능을 제공하며GitHub 리포지토리. 용 step-by-step 지침, 단원을 참조하십시오자습서: DSBulk를 사용하여 Amazon Keyspaces 스페이스로 데이터 로드.

    • Apache Cassandra Spark 커넥터를 사용하여 Amazon 키스페이스에 데이터를 쓰는 방법을 알아보려면 단원을 참조하십시오.아마존 키스페이스와 아파치 스파크의 통합.

    • 복잡한 마이그레이션의 경우 추출, 변환 및 로드 (ETL) 도구를 사용하는 것이 좋습니다. Amazon EMR 사용하여 데이터 변환 워크로드를 빠르고 효과적으로 수행할 수 있습니다. 자세한 내용은 Amazon EMR 관리 안내서를 참조하세요.