Amazon S3로 DynamoDB 데이터 내보내기: 작동 방식 - Amazon DynamoDB

Amazon S3로 DynamoDB 데이터 내보내기: 작동 방식

Amazon DynamoDB 테이블에서 Amazon S3 버킷으로 데이터를 내보내려면 소스 테이블에서 특정 시점으로 복구(PITR)를 활성화해야 합니다. PITR 기간 내의 특정 시점부터 최대 35일까지의 테이블 데이터를 내보낼 수 있습니다. 자세한 내용은 DynamoDB의 특정 시점으로 복구 섹션을 참조하세요.

테이블 내보내기는 테이블의 읽기 용량을 사용하지 않으며 테이블 성능 및 가용성에 영향을 주지 않습니다. 테이블 데이터를 다른 AWS 계정이 소유한 S3 버킷 및 해당 테이블이 있는 리전과 다른 리전으로 내보낼 수 있습니다. 데이터는 저장 전송 중에 항상 암호화됩니다.

데이터를 DynamoDB JSON 형식 또는 Amazon Ion 텍스트 형식으로 내보낼 수 있습니다. 내보내기 형식에 대한 자세한 내용은 데이터 객체 단원을 참조하세요.

해당 테이블에 쓸 수 있는 올바른 권한이 있으면 다른 계정이 소유한 S3 버킷으로 데이터를 내보낼 수 있습니다. 대상 버킷이 소스 테이블과 다른 리전에 있어도 됩니다. 자세한 내용은 Amazon S3 설정 및 권한 섹션을 참조하세요.

최대 300개의 내보내기 태스크 또는 최대 100TB의 테이블 크기를 동시에 내보낼 수 있습니다.

요청 시간과 데이터 레이크 내보내기 요청에 포함되는 마지막 업데이트의 시간은 1분 시간 내에서 달라질 수 있습니다. 예를 들어 오후 2시 25분에 요청을 제출하면 출력에 최대 2시 24분까지 테이블에 커밋된 모든 데이터가 포함되며 2시 26분 이후에 커밋된 데이터는 포함되지 않습니다. 2시 24분~2시 26분 사이의 데이터 수정 사항은 출력에 포함될 수도, 포함되지 않을 수도 있습니다. 또한 내보낸 데이터는 트랜잭션에서 일관성이 없습니다.

AWS CloudTrail은 로깅, 지속적인 모니터링, 감사를 지원하기 위해 테이블 내보내기의 콘솔 및 API 작업을 모두 로그합니다. 자세한 내용은 AWS CloudTrail을 사용하여 DynamoDB 작업 로깅 섹션을 참조하세요.

DynamoDB 테이블 내보내기는 테이블 스캔을 사용한 테이블 내보내기보다 더 빠르도록 설계되었습니다. 그러나 내보내기 완료에 걸리는 정확한 시간은 테이블의 크기와 테이블 데이터의 분산 균일도에 따라 다릅니다. 사용 사례에 실시간 분석이 포함되는 경우 Amazon Kinesis Data Streams를 사용할 수 있습니다. 자세한 내용은 Amazon Kinesis Data Streams 개발자 안내서를 참조하세요.

Amazon S3에 대한 자세한 내용은 Amazon Simple Storage Service 개발자 안내서를 참조하세요.