4단계: 구성DSBulk설정 - Amazon Keyspaces(Apache Cassandra용)

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

4단계: 구성DSBulk설정

이 단원에서는 Amazon 키스페이스에 데이터를 업로드하기 위해 DSBulk를 구성하는 데 필요한 단계를 간략하게 설명합니다. 구성 파일을 사용하여 DSBulk를 구성합니다. 구성 파일은 명령줄에서 직접 지정합니다.

  1. Amazon 키스페이스로 마이그레이션하기 위한 DSBulk 구성 파일을 생성합니다. 이 예에서는 파일 이름을 사용합니다.dsbulk_keyspaces.conf. DSBulk 구성 파일에서 다음 설정을 지정합니다.

    1. PlainTextAuthProvider— 를 사용하여 인증 제공자를 생성합니다.PlainTextAuthProvider클래스.ServiceUserNameServicePassword의 단계에 따라 서비스별 자격 증명을 생성할 때 얻은 사용자 이름 및 암호와 일치해야 합니다.프로그래밍 방식으로 Amazon 키스페이스에 액세스하기 위한 자격 증명 생성.

    2. local-datacenter— 의 값을 설정합니다.local-datacenter에AWS 리전당신이 연결하고 있는 것이죠. 예를 들어 응용 프로그램이 연결 중인 경우cassandra.us-east-2.amazonaws.com을 탭한 다음 로컬 데이터 센터를us-east-2. 사용 가능한 모든AWS 리전참조Amazon 키스페이스의 서비스 엔드포인트.

    3. SSLEngineFactory— SSL/TLS를 구성하려면SSLEngineFactory구성 파일에 다음과 같이 클래스를 지정하는 한 줄로 섹션을 추가하여class = DefaultSslEngineFactory. 경로 제공cassandra_truststore.jks및 이전에 생성한 비밀번호입니다.

    4. consistency—일관성 수준을 (으) 로 설정LOCAL QUORUM그리고 전원을 끄세요token_metadata환경. 다른 쓰기 일관성 수준은 지원되지 않습니다. 자세한 내용은 을 참조하십시오.Amazon 키스페이스에서 지원되는 아파치 카산드라 일관성 수준.

    다음은 전체 샘플 구성 파일입니다.

    datastax-java-driver { basic.contact-points = [ "cassandra.us-east-2.amazonaws.com:9142"] advanced.auth-provider { class = PlainTextAuthProvider username = "ServiceUserName" password = "ServicePassword" } basic.load-balancing-policy { local-datacenter = "us-east-2" } basic.request { consistency = LOCAL_QUORUM default-idempotence = true } advanced.ssl-engine-factory { class = DefaultSslEngineFactory truststore-path = "./cassandra_truststore.jks" truststore-password = "my_password" hostname-validation = false } advanced.metadata { schema { token-map.enabled = false } } }
  2. DSBulk의 파라미터를 검토합니다.load명령.

    1. executor.maxPerSecond— load 명령이 초당 동시에 처리하려고 시도하는 최대 행 수입니다. 설정되지 않은 경우 이 설정은 -1로 비활성화됩니다.

      Setexecutor.maxPerSecond대상 대상 테이블에 프로비저닝한 WCU의 수를 기반으로 합니다. 이executor.maxPerSecondload명령은 한계가 아니라 목표 평균입니다. 즉, 설정한 숫자 이상으로 버스트될 수 있으며 종종 발생합니다. 버스트를 허용하고 데이터 로드 요청을 처리할 수 있는 충분한 용량이 있는지 확인하려면executor.maxPerSecond테이블 쓰기 용량의 90% 까지

      executor.maxPerSecond = WCUs * .90

      이 자습서에서는executor.maxPerSecond[5.

      참고

      DSBulk 1.6.0 이상을 사용하는 경우 다음을 사용할 수 있습니다.dsbulk.engine.maxConcurrentQueries대신에.

    2. DSBulk에 대해 이러한 추가 매개 변수를 구성합니다.load명령.

      • batch-mode— 이 매개 변수는 파티션 키별로 작업을 그룹화하도록 시스템에 지시합니다. 이렇게 하면 다른 설정에 방해가 될 수 있으므로 배치 모드를 비활성화하는 것이 좋습니다.

      • driver.advanced.retry-policy-max-retries— 실패한 쿼리 재시도 횟수를 결정합니다. 설정되지 않은 경우 기본값은 10입니다. 필요에 따라 이 값을 조정할 수 있습니다.

      • driver.basic.request.timeout— 시스템이 쿼리가 반환될 때까지 기다리는 시간 (분) 입니다. 설정되지 않은 경우 기본값은 “5분”입니다. 필요에 따라 이 값을 조정할 수 있습니다.