SVL_S3QUERY_SUMMARY - Amazon Redshift

SVL_S3QUERY_SUMMARY

시스템에서 실행된 모든 Amazon Redshift Spectrum 쿼리(S3 쿼리)의 요약을 가져오려면 SVL_S3QUERY_SUMMARY 뷰를 사용합니다. SVL_S3QUERY_SUMMARY는 세그먼트 수준에서 SVL_S3QUERY의 세부 정보를 집계합니다.

SVL_S3QUERY_SUMMARY는 모든 사용자에게 표시됩니다. 수퍼유저는 모든 행을 볼 수 있지만 일반 사용자는 자체 데이터만 볼 수 있습니다. 자세한 내용은 시스템 테이블 및 뷰에 있는 데이터의 가시성 단원을 참조하십시오.

이 테이블의 데이터 중 일부 또는 전부는 SYS 모니터링 뷰인 SYS_EXTERNAL_QUERY_DETAIL에서도 찾아볼 수 있습니다. SYS 모니터링 뷰의 데이터는 사용 및 이해가 더 쉽도록 형식이 지정되어 있습니다. 쿼리에 SYS 모니터링 뷰를 사용하는 것이 좋습니다.

SVCS_S3QUERY_SUMMARY에 대한 자세한 내용은 SVCS_S3QUERY_SUMMARY 섹션을 참조하세요.

테이블 열

열 명칭 데이터 유형 설명
userid 정수 지정된 항목을 생성한 사용자의 ID.
쿼리 정수 쿼리 ID입니다. 이 값을 사용하여 다양한 다른 시스템 테이블 및 뷰를 조인할 수 있습니다.
xid bigint 트랜잭션 ID.
pid 정수 프로세스 ID.
segment 정수 세그먼트 번호. 하나의 쿼리는 여러 세그먼트로 구성되며, 각각의 세그먼트는 하나 이상의 단계로 구성됩니다.
step 정수 실행된 쿼리 단계입니다.
starttime 타임스탬프 쿼리가 실행되기 시작한 UTC 시간.
endtime 타임스탬프 쿼리가 완료된 UTC 시간.
elapsed 정수 쿼리가 실행되는 데 걸린 시간 길이(마이크로초).
aborted 정수 쿼리가 시스템에 의해 중지되거나 사용자에 의해 취소되는 경우, 이 열에 1이 포함됩니다. 쿼리가 실행되어 완료되면 이 열에 0이 포함됩니다.
external_table_name char(136) 외부 테이블 스캔을 위한 테이블 외부 이름의 내부 형식입니다.
file_format character(16) 외부 테이블 데이터의 파일 형식입니다.
is_partitioned char(1) true(t)인 경우, 이 열 값은 외부 테이블이 파티셔닝되어 있음을 나타냅니다.
is_rrscan char(1) true(t)인 경우, 이 열 값은 범위 제한 스캔이 적용되었음을 나타냅니다.
is_nested char(1) true(t)인 경우 이 열 값은 중첩 열 데이터 형식에 액세스했음을 나타냅니다.
s3_scanned_rows bigint Amazon S3에서 스캔되어 Redshift Spectrum 계층으로 전송된 행의 수.
s3_scanned_bytes bigint 압축된 데이터를 기반으로 Amazon S3에서 스캔되어 Redshift Spectrum 계층으로 전송된 바이트의 수.
s3query_returned_rows bigint Redshift Spectrum 계층에서 클러스터로 반환된 행의 수.
s3query_returned_bytes bigint Redshift Spectrum 계층에서 클러스터로 반환된 바이트의 수. Amazon Redshift로 반환되는 데이터의 양이 많으면 시스템 성능이 영향을 받을 수 있습니다.
files 정수 이 Redshift Spectrum 쿼리에 대해 처리된 파일의 수. 파일 수가 적으면 병렬 처리의 이점이 제한됩니다.
files_max 정수 한 조각에서 처리된 파일의 최대 개수입니다.
files_avg 정수 한 조각에서 처리된 파일의 평균 개수입니다.
splits int 이 세그먼트에 대해 처리되는 분할 수입니다. 이 조각에서 처리되는 분할 수입니다. 분할할 수 있는 큰 데이터 파일의 경우, 예를 들어 약 512MB보다 큰 데이터 파일의 경우 Redshift Spectrum은 병렬 처리를 위해 파일을 여러 개의 S3 요청으로 분할하려고 합니다.
splits_max int 이 조각에서 처리되는 최대 분할 수입니다.
splits_avg int 이 조각에서 처리되는 평균 분할 수입니다.
total_split_size bigint 처리되는 모든 분할의 총 크기입니다.
max_split_size bigint 처리되는 최대 분할 크기(바이트)입니다.
avg_split_size bigint 처리되는 평균 분할 크기(바이트)입니다.
total_retries 정수 처리된 하나의 개별 파일에 대한 총 재시도 횟수.
max_retries 정수 처리된 임의의 파일에 대한 최대 재시도 횟수.
max_request_duration 정수 개별 파일 요청의 최대 지속 시간(마이크로초). 오랫동안 실행 중인 쿼리는 병목 현상을 나타낼 수 있습니다.
avg_request_duration 배정밀도 파일 요청의 평균 지속 시간(마이크로초).
max_request_parallelism 정수 이 Redshift Spectrum 쿼리에 대해 한 개의 조각에 있는 최대 병렬 요청 수입니다.
avg_request_parallelism double precision 이 Redshift Spectrum 쿼리에 대해 한 개의 조각에 있는 평균 병렬 요청 수입니다.
total_slowdown_count bigint 외부 테이블 스캔 중에 속도가 느려지는 오류가 발생한 총 Amazon S3 요청 수입니다.
max_slowdown_count 정수 한 조각의 외부 테이블 스캔 중에 속도가 느려지는 오류가 발생한 최대 Amazon S3 요청 수입니다.

샘플 쿼리

다음 예는 마지막으로 완료된 쿼리에 대한 스캔 단계 세부 정보를 가져옵니다.

select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svl_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+---------+-----------------+------------------+-----------------------+------------------------+------
 4587 |       2 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  216671 |               0 |                0 |                     0 |                      0 |     0