SVCS_S3QUERY_SUMMARY
可以使用 SVCS_S3QUERY_SUMMARY 视图获取已在系统上运行的所有 Redshift Spectrum 查询(S3 查询)的摘要。一个段可以执行一个外部表扫描。
注意
带有前缀 SVCS 的系统视图提供了有关主集群和并发扩展集群上的查询的详细信息。这些视图与带有前缀 SVL 的视图类似,但 SVL 视图仅提供在主集群上运行的查询的信息。
SVCS_S3QUERY_SUMMARY 对所有用户可见。超级用户可以查看所有行;普通用户只能查看其自己的数据。有关更多信息,请参阅 系统表和视图中的数据可见性。
有关 SVL_S3QUERY 的信息,请参阅 SVL_S3QUERY。
表列
列名称 | 数据类型 | 描述 |
---|---|---|
userid | integer | 已生成给定条目的用户的 ID。 |
query | integer | 查询 ID。您可以使用此值联接各种其他系统表和视图。 |
xid | bigint | 事务 ID。 |
pid | integer | 进程 ID。 |
segment | integer | 段编号。一个查询包含多个区段,而且每个区段包含一个或多个步骤。 |
step | integer | 运行的查询步骤。 |
starttime | timestamp | 开始运行该段中的 Redshift Spectrum 查询的 UTC 时间。一个段可以具有一个外部表扫描。 |
endtime | timestamp | 完成该段中的 Redshift Spectrum 查询的 UTC 时间。一个段可以具有一个外部表扫描。 |
elapsed | integer | 运行该段中的 Redshift Spectrum 查询所需的时间长度(以微秒为单位)。 |
aborted | integer | 如果查询已由系统停止或已由用户取消,则此列包含 1 。如果查询运行完成,则此列包含 0 。 |
external_table_name | char(136) | 外部表扫描的表的外部名称的名称内部格式。 |
file_format | character(16) | 外部表数据的文件格式。 |
is_partitioned | char(1) | 如果为 true (t ),则此列值表示外部表已进行分区。 |
is_rrscan | char(1) | 如果为 true (t ),则此列值表示已应用限制范围的扫描。 |
is_nested | varchar(1) | 如果为 true (t ),该列值表示访问嵌套的列数据类型。 |
s3_scanned_rows | bigint | 已从 Amazon S3 扫描并发送到 Redshift Spectrum 层的行数量。 |
s3_scanned_bytes | bigint | 已从 Amazon S3 扫描并发送到 Redshift Spectrum 层的基于压缩数据的字节的数量。 |
s3query_returned_rows | bigint | 已从 Redshift Spectrum 层返回到集群的行的数量。 |
s3query_returned_bytes | bigint | 已从 Redshift Spectrum 层返回到集群的字节的数量。返回到 Amazon Redshift 的大量数据可能会影响系统性能。 |
files | integer | 针对此 Redshift Spectrum 查询已处理的文件的数量。文件数量少会限制并行处理的优势。 |
files_max | integer | 一个切片上处理的最大文件数。 |
files_avg | integer | 一个切片上处理的平均文件数。 |
splits | bigint | 为此分段处理的拆分数。在此切片上处理的拆分数。对于大型可拆分数据文件(例如,大于 512 MB 左右的数据文件),Redshift Spectrum 会尝试将文件拆分为多个 S3 请求以便进行并行处理。 |
splits_max | integer | 在此切片上处理的最大拆分数。 |
splits_avg | bigint | 在此切片上处理的平均拆分数。 |
total_split_size | bigint | 处理的所有拆分的总大小。 |
max_split_size | bigint | 处理的最大拆分大小(以字节为单位)。 |
avg_split_size | bigint | 处理的平均拆分大小(以字节为单位)。 |
total_retries | bigint | 该段中的 Redshift Spectrum 查询的总重试次数。 |
max_retries | integer | 一个处理的文件的最大重试次数。 |
max_request_duration | bigint | 单个文件请求的最长持续时间(以微秒为单位)。长时间运行的查询可能表示瓶颈。 |
avg_request_duration | bigint | 文件请求的平均持续时间(以微秒为单位)。 |
max_request_parallelism | integer | 该 Redshift Spectrum 查询的一个切片中的最大并行请求数。 |
avg_request_parallelism | double precision | 该 Redshift Spectrum 查询的一个切片中的平均并行请求数。 |
total_slowdown_count | bigint | 在外部表扫描期间出现减速错误的总 Amazon S3 请求数。 |
max_slowdown_count | integer | 在一个切片上的外部表扫描期间出现减速错误的最大 Amazon S3 请求数。 |
示例查询
以下示例获取上次运行的查询的扫描步骤详细信息。
select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svcs_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files ------+---------+---------+-----------------+------------------+-----------------------+------------------------+------ 4587 | 2 | 67811 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 591568 | 172462 | 11260097 | 8513 | 170260 | 1 4587 | 2 | 216849 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 216671 | 0 | 0 | 0 | 0 | 0