SVCS_S3QUERY_SUMMARY - Amazon Redshift

SVCS_S3QUERY_SUMMARY

시스템에서 실행된 모든 Redshift Spectrum 쿼리(S3 쿼리)의 요약을 가져오려면 SVCS_S3QUERY_SUMMARY 뷰를 사용합니다. 한 개의 세그먼트로 한 개의 외부 테이블 스캔을 수행할 수 있습니다.

참고

접두사 SVCS를 포함하는 시스템 뷰는 동시성 확장 클러스터와 기본 클러스터 모두의 쿼리에 대한 세부 정보를 제공합니다. 이 뷰는 접두사 SVL을 포함하는 뷰와 유사합니다. 단, SVL 뷰는 기본 클러스터에서 실행된 쿼리에 대한 정보만 제공합니다.

SVCS_S3QUERY_SUMMARY는 모든 사용자에게 표시됩니다. 수퍼유저는 모든 행을 볼 수 있지만 일반 사용자는 자체 데이터만 볼 수 있습니다. 자세한 내용은 시스템 테이블 및 뷰에 있는 데이터의 가시성 섹션을 참조하세요.

SVL_S3QUERY에 대한 자세한 내용은 SVL_S3QUERY 섹션을 참조하세요.

테이블 열

열 명칭 데이터 유형 설명
userid 정수 지정된 항목을 생성한 사용자의 ID.
쿼리 정수 쿼리 ID입니다. 이 값을 사용하여 다양한 다른 시스템 테이블 및 뷰를 조인할 수 있습니다.
xid bigint 트랜잭션 ID.
pid 정수 프로세스 ID.
segment 정수 세그먼트 번호. 하나의 쿼리는 여러 세그먼트로 구성되며, 각각의 세그먼트는 하나 이상의 단계로 구성됩니다.
step 정수 실행된 쿼리 단계입니다.
starttime 타임스탬프 이 세그먼트의 Redshift Spectrum 쿼리가 실행되기 시작한 UTC 시간입니다. 한 개의 세그먼트로 한 개의 외부 테이블 스캔을 수행할 수 있습니다.
endtime 타임스탬프 이 세그먼트의 Redshift Spectrum 쿼리가 완료된 UTC 시간입니다. 한 개의 세그먼트로 한 개의 외부 테이블 스캔을 수행할 수 있습니다.
elapsed 정수 이 세그먼트의 Redshift Spectrum 쿼리가 실행되는 데 걸린 시간(마이크로초)입니다.
aborted 정수 쿼리가 시스템에 의해 중지되거나 사용자에 의해 취소되는 경우, 이 열에 1이 포함됩니다. 쿼리가 실행되어 완료되면 이 열에 0이 포함됩니다.
external_table_name char(136) 외부 테이블 스캔을 위한 테이블 외부 이름의 내부 형식입니다.
file_format character(16) 외부 테이블 데이터의 파일 형식입니다.
is_partitioned char(1) true(t)인 경우, 이 열 값은 외부 테이블이 파티셔닝되어 있음을 나타냅니다.
is_rrscan char(1) true(t)인 경우, 이 열 값은 범위 제한 스캔이 적용되었음을 나타냅니다.
is_nested varchar(1) true(t)인 경우 이 열 값은 중첩 열 데이터 형식에 액세스했음을 나타냅니다.
s3_scanned_rows bigint Amazon S3에서 스캔되어 Redshift Spectrum 계층으로 전송된 행의 수.
s3_scanned_bytes bigint 압축된 데이터를 기반으로 Amazon S3에서 스캔되어 Redshift Spectrum 계층으로 전송된 바이트의 수.
s3query_returned_rows bigint Redshift Spectrum 계층에서 클러스터로 반환된 행의 수.
s3query_returned_bytes bigint Redshift Spectrum 계층에서 클러스터로 반환된 바이트의 수. Amazon Redshift로 반환되는 데이터의 양이 많으면 시스템 성능이 영향을 받을 수 있습니다.
files 정수 이 Redshift Spectrum 쿼리에 대해 처리된 파일의 수. 파일 수가 적으면 병렬 처리의 이점이 제한됩니다.
files_max 정수 한 조각에서 처리된 파일의 최대 개수.
files_avg 정수 한 조각에서 처리된 파일의 평균 개수.
splits bigint 이 세그먼트에 대해 처리되는 분할 수입니다. 이 조각에서 처리되는 분할 수입니다. 분할할 수 있는 큰 데이터 파일의 경우, 예를 들어 약 512MB보다 큰 데이터 파일의 경우 Redshift Spectrum은 병렬 처리를 위해 파일을 여러 개의 S3 요청으로 분할하려고 합니다.
splits_max 정수 이 조각에서 처리되는 최대 분할 수입니다.
splits_avg bigint 이 조각에서 처리되는 평균 분할 수입니다.
total_split_size bigint 처리되는 모든 분할의 총 크기입니다.
max_split_size bigint 처리되는 최대 분할 크기(바이트)입니다.
avg_split_size bigint 처리되는 평균 분할 크기(바이트)입니다.
total_retries bigint 이 세그먼트에서 Redshift Spectrum 쿼리에 대한 총 재시도 횟수입니다.
max_retries 정수 처리된 개별 파일의 최대 재시도 횟수입니다.
max_request_duration bigint 개별 파일 요청의 최대 지속 시간(마이크로초)입니다. 오랫동안 실행 중인 쿼리는 병목 현상을 나타낼 수 있습니다.
avg_request_duration bigint 파일 요청의 평균 지속 시간(마이크로초)입니다.
max_request_parallelism 정수 이 Redshift Spectrum 쿼리에 대해 한 개의 조각에 있는 최대 병렬 요청 수입니다.
avg_request_parallelism double precision 이 Redshift Spectrum 쿼리에 대해 한 개의 조각에 있는 평균 병렬 요청 수입니다.
total_slowdown_count bigint 외부 테이블 스캔 중에 속도가 느려지는 오류가 발생한 총 Amazon S3 요청 수입니다.
max_slowdown_count 정수 한 조각의 외부 테이블 스캔 중에 속도가 느려지는 오류가 발생한 최대 Amazon S3 요청 수입니다.

샘플 쿼리

다음 예는 마지막으로 실행된 쿼리에 대한 스캔 단계 세부 정보를 가져옵니다.

select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svcs_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+---------+-----------------+------------------+-----------------------+------------------------+------               
 4587 |       2 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  216671 |               0 |                0 |                     0 |                      0 |     0