다중 스레드 이진 로그 복제 binlog 복제 최적화 인 메모리 릴레이 로그

Aurora MySQL의 이진수 로그 복제 최적화

다음으로 Aurora MySQL에서 이진 로그 복제 성능을 최적화하고 관련 문제를 해결하는 방법을 배울 수 있습니다.

작은 정보

이 논의에서는 MySQL 이진 로그 복제 메커니즘과 작동 방식에 대해 잘 알고 있다고 가정합니다. 배경 정보는 MySQL 설명서의 복제 구현 단원을 참조하세요.

다중 스레드 이진 로그 복제

다중 스레드 이진 로그 복제를 사용하면 SQL 스레드가 릴레이 로그에서 이벤트를 읽고 SQL 작업자 스레드에서 적용하도록 이벤트를 대기열에 넣습니다. SQL 작업자 스레드는 조정자 스레드에서 관리합니다. 가능한 경우 이진 로그 이벤트가 병렬로 적용됩니다. 병렬 처리 수준은 버전, 파라미터, 스키마 설계 및 워크로드 특성을 비롯한 요인에 따라 달라집니다.

다중 스레드 이진 로그 복제는 Aurora MySQL 버전 3, Aurora MySQL 버전 2.12.1 이상에서 지원됩니다. 다중 스레드 복제본이 binlog 이벤트를 병렬로 효율적으로 처리하려면 멀티스레드 바이너리 로그 복제를 위한 소스를 구성해야 하며, 소스는 바이너리 로그 파일에 병렬 처리 정보가 포함된 버전을 사용해야 합니다.

Aurora MySQL DB 인스턴스가 binlog 복제를 사용하도록 구성된 경우 복제본 인스턴스는 Aurora MySQL 3.04 미만 버전에 기본적으로 단일 스레드 복제를 사용합니다. 다중 스레드 복제를 사용 설정하려면 replica_parallel_workers 파라미터를 사용자 지정 파라미터 그룹에서 1보다 큰 값으로 업데이트합니다.

Aurora MySQL 버전 3.04 이상에서는 복제가 기본적으로 다중 스레드로 설정되며 replica_parallel_workers가 4로 설정됩니다. 사용자 지정 파라미터 그룹에서 이 파라미터를 수정할 수 있습니다.

예기치 않은 중단에 대한 데이터베이스의 복원력을 높이려면 소스에서 GTID 복제를 사용 설정하고 복제본에서 GTID를 허용하는 것이 좋습니다. GTID 복제를 허용하려면 소스와 복제본 모두에서 gtid_mode를 ON_PERMISSIVE로 설정합니다. GTID 기반 복제에 대한 자세한 내용은 GTID 기반 복제 사용 단원을 참조하십시오.

다음 구성 옵션을 사용하면 다중 스레드 복제를 세부 조정할 수 있습니다. 사용 정보는 MySQL 참조 설명서의 복제, 이진 로깅 옵션 및 변수를 참조하세요. 다중 스레드 복제에 대한 자세한 내용은 MySQL 블로그 Improving the Parallel Applier with Writeset-based Dependency Tracking 섹션을 참조하시기 바랍니다.

최적의 파라미터 값은 여러 요인에 따라 달라집니다. 예를 들어 이진 로그 복제의 성능은 데이터베이스 워크로드 특성과 복제본이 실행 중인 DB 인스턴스 클래스의 영향을 받습니다. 따라서 프로덕션 인스턴스에 새 파라미터 설정을 적용하기 전에 이러한 구성 파라미터에 대한 모든 변경 사항을 철저히 테스트하는 것이 좋습니다.

binlog_format recommended value - 로 설정됨ROW
binlog_group_commit_sync_delay
binlog_group_commit_sync_no_delay_count
binlog_transaction_dependency_history_size
binlog_transaction_dependency_tracking - 권장 값은 WRITESET입니다.
replica_preserve_commit_order
replica_parallel_type - 권장 값은 LOGICAL_CLOCK입니다.
replica_parallel_workers
replica_pending_jobs_size_max
transaction_write_set_extraction - 권장 값은 XXHASH64입니다.

스키마 및 워크로드 특성은 병렬 복제에 영향을 미치는 요소입니다. 가장 일반적인 요소는 다음과 같습니다.

프라이머리 키 없음 - RDS는 프라이머리 키가 없는 테이블에 대한 쓰기 세트 종속성을 설정할 수 없습니다. ROW 형식을 사용하면 소스에서 단일 전체 테이블 스캔으로 단일 다중 행 스테이트먼트를 수행할 수 있지만 복제본에서 행당 하나의 전체 테이블 스캔이 수정됩니다. 프라이머리 키가 없으면 복제 처리량이 크게 줄어듭니다.
외부 키의 존재 - 외부 키가 있는 경우 Amazon RDS는 FK 관계의 테이블 병렬화에 쓰기 세트 종속성을 사용할 수 없습니다.
트랜잭션 크기 - 단일 트랜잭션이 수십 또는 수백 메가바이트 또는 기가바이트에 걸쳐 있는 경우 작업자 스레드 중 하나와 조정자 스레드에서 해당 트랜잭션만 처리하는 데 오랜 시간이 걸릴 수 있습니다. 이 기간 동안 다른 모든 작업자 스레드는 이전 트랜잭션 처리를 완료한 후에도 유휴 상태로 유지될 수 있습니다.

Aurora MySQL 버전 3.06 이상에서는 보조 인덱스가 두 개 이상인 대규모 테이블의 트랜잭션을 복제할 때 binlog 복제본의 성능을 개선할 수 있습니다. 이 기능은 binlog 복제본에서 보조 인덱스 변경 사항을 병렬로 적용하는 스레드 풀을 도입합니다. 이 기능은 보조 인덱스 변경 사항을 적용하는 데 사용할 수 있는 총 병렬 스레드 수를 제어하는 aurora_binlog_replication_sec_index_parallel_workers DB 클러스터 파라미터에 의해 제어됩니다. 기본적으로 파라미터는 0(비활성화됨)로 설정됩니다. 이 기능을 활성화해도 인스턴스를 다시 시작할 필요가 없습니다. 이 기능을 활성화하려면 진행 중인 복제를 중지하고 원하는 수의 병렬 작업자 스레드를 설정한 다음 복제를 다시 시작하세요.

binlog 복제 최적화

Aurora MySQL 2.10 이상에서 Aurora는 binlog I/O 캐시라는 최적화를 바이너리 로그 복제에 자동으로 적용합니다. 이 최적화는 가장 최근에 커밋된 binlog 이벤트를 캐싱하여 binlog 덤프 스레드 성능을 개선하고 binlog 소스 인스턴스에 대한 포그라운드 트랜잭션에 미치는 영향을 제한하도록 설계되었습니다.

참고

이 기능에 사용되는 메모리는 MySQL binlog_cache 설정과 독립적입니다.

이 기능은 db.t2 및 db.t3 인스턴스 클래스를 사용하는 Aurora DB 인스턴스에는 적용되지 않습니다.

이 최적화를 켜기 위해 구성 파라미터를 조정할 필요가 없습니다. 특히 이전 Aurora MySQL 버전에서 구성 파라미터 aurora_binlog_replication_max_yield_seconds를 0이 아닌 값으로 조정한 경우 현재 사용 가능한 버전에서 0으로 다시 설정하세요.

상태 변수 aurora_binlog_io_cache_reads 및 aurora_binlog_io_cache_read_requests는 binlog I/O 캐시의 데이터를 읽는 빈도를 모니터링하는 데 도움이 됩니다.

aurora_binlog_io_cache_read_requests는 캐시의 binlog I/O 읽기 요청 수를 보여줍니다.
aurora_binlog_io_cache_reads는 캐시의 정보를 검색하는 binlog I/O 읽기 수를 보여줍니다.

다음 SQL 쿼리는 캐시된 정보를 활용하는 binlog 읽기 요청의 백분율을 계산합니다. 이 경우 비율이 100에 가까울수록 더 좋습니다.


mysql> SELECT
  (SELECT VARIABLE_VALUE FROM INFORMATION_SCHEMA.GLOBAL_STATUS
    WHERE VARIABLE_NAME='aurora_binlog_io_cache_reads')
  / (SELECT VARIABLE_VALUE FROM INFORMATION_SCHEMA.GLOBAL_STATUS
    WHERE VARIABLE_NAME='aurora_binlog_io_cache_read_requests')
  * 100
  as binlog_io_cache_hit_ratio;
+---------------------------+
| binlog_io_cache_hit_ratio |
+---------------------------+
|         99.99847949080622 |
+---------------------------+

binlog I/O 캐시 기능에는 binlog 덤프 스레드와 관련된 새로운 지표도 포함됩니다. 덤프 스레드는 새로운 binlog 복제본이 binlog 소스 인스턴스에 연결될 때 생성되는 스레드입니다.

덤프 스레드 지표는 60초 간격으로 접두사 [Dump thread metrics]를 사용하여 데이터베이스 로그에 인쇄됩니다. 지표에는 Secondary_id, Secondary_uuid, binlog 파일 이름 및 각 복제본에서 읽는 중인 위치와 같은 각 binlog 복제본에 대한 정보가 포함됩니다. 지표에는 복제 소스와 복제본 간의 거리(바이트)를 나타내는 Bytes_behind_primary도 포함됩니다. 이 지표는 복제본 I/O 스레드의 지연을 측정합니다. 이 수치는 binlog 복제본에서 seconds_behind_master 지표로 표시되는 복제본 SQL 적용자 스레드의 지연과 다릅니다. 이 거리의 감소 또는 증가를 확인하여 binlog 복제본이 소스를 따라 잡고 있는지, 뒤쳐지지 않는지 확인할 수 있습니다.

인 메모리 릴레이 로그

Aurora MySQL 버전 3.10 이상에서 Aurora는 복제 처리량을 개선하기 위해 인 메모리 릴레이 로그라고 하는 최적화를 도입합니다. 이 최적화는 메모리의 모든 중간 릴레이 로그 콘텐츠를 캐싱하여 릴레이 로그 I/O 성능을 향상시킵니다. 따라서 릴레이 로그 콘텐츠가 메모리에서 쉽게 액세스할 수 있으므로 스토리지 I/O 작업을 최소화하여 커밋 지연 시간을 줄입니다.

기본적으로 인 메모리 릴레이 로그 기능은 복제본이 다음 구성 중 하나를 충족할 때 Aurora 관리형 복제 시나리오(블루/그린 배포, Aurora-Aurora 복제 및 리전 간 복제본 포함)에 대해 자동으로 활성화됩니다.

단일 스레드 복제 모드(replica_parallel_workers = 0)
GTID 모드가 활성화된 다중 스레드 복제:
- 자동 위치 활성화
- 복제본에서 GTID 모드가 ON으로 설정됨
replica_preserve_commit_order = ON인 파일 기반 복제

인 메모리 릴레이 로그 기능은 t3.large보다 큰 인스턴스 클래스에서 지원되지만 Aurora Serverless 인스턴스에서는 사용할 수 없습니다. 릴레이 로그 원형 버퍼의 고정 크기는 128MB입니다. 이 기능의 메모리 사용량을 모니터링하기 위해 다음 쿼리를 실행할 수 있습니다.


SELECT event_name, current_alloc FROM sys.memory_global_by_current_bytes WHERE event_name = 'memory/sql/relaylog_io_cache';

인 메모리 릴레이 로그 기능은 DB 클러스터 또는 인스턴스 수준에서 설정할 수 있는 aurora_in_memory_relaylog 파라미터에 의해 제어됩니다. 인스턴스를 다시 시작하지 않고도 이 기능을 동적으로 활성화하거나 비활성화할 수 있습니다.

진행 중인 복제 중지
파라미터 그룹에서 aurora_in_memory_relaylog를 ON(활성화) 또는 OFF(비활성화)로 설정합니다.
복제 다시 시작

예제:


CALL mysql.rds_stop_replication;
set aurora_in_memory_relaylog to ON to enable or OFF to disable in cluster parameter group
CALL mysql.rds_start_replication;

aurora_in_memory_relaylog가 ON으로 설정된 경우에도 특정 조건에서는 인 메모리 릴레이 로그 기능이 비활성화될 수 있습니다. 다음 명령을 사용하여 기능의 현재 상태를 확인할 수도 있습니다.


SHOW GLOBAL STATUS LIKE 'Aurora_in_memory_relaylog_status';

기능이 예기치 않게 비활성화된 경우 다음을 실행하여 이유를 식별할 수 있습니다.


SHOW GLOBAL STATUS LIKE 'Aurora_in_memory_relaylog_disabled_reason';

이 명령은 기능이 현재 비활성화된 이유를 설명하는 메시지를 반환합니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

MySQL 읽기 규모 조정

향상된 binlog 설정