SVL_S3QUERY_SUMMARY
使用 SVL_S3QUERY_SUMMARY 视图可获取已在系统上运行的所有 Amazon Redshift Spectrum 查询(S3 查询)的汇总。SVL_S3QUERY_SUMMARY 汇总段级别的 SVL_S3QUERY 的详细信息。
SVL_S3QUERY_SUMMARY 对所有用户可见。超级用户可以查看所有行;普通用户只能查看其自己的数据。有关更多信息,请参阅 系统表和视图中的数据可见性。
此表中的部分或全部数据也可以在 SYS 监控视图 SYS_EXTERNAL_QUERY_DETAIL 中找到。SYS 监控视图中的数据经过格式化处理,便于使用和理解。我们建议您使用 SYS 监控视图进行查询。
对于 SVCS_S3QUERY_SUMMARY,请参阅 SVCS_S3QUERY_SUMMARY。
表列
列名称 | 数据类型 | 描述 |
---|---|---|
userid | integer | 已生成给定条目的用户的 ID。 |
query | integer | 查询 ID。您可以使用此值联接各种其他系统表和视图。 |
xid | bigint | 事务 ID。 |
pid | integer | 进程 ID。 |
segment | integer | 段编号。一个查询包含多个区段,而且每个区段包含一个或多个步骤。 |
step | integer | 运行的查询步骤。 |
starttime | timestamp | 开始执行查询的时间(采用 UTC 表示)。 |
endtime | timestamp | 查询完成的时间(采用 UTC 表示)。 |
elapsed | integer | 运行查询花费的时长(单位为微秒)。 |
aborted | integer | 如果查询已由系统停止或已由用户取消,则此列包含 1 。如果查询运行完成,则此列包含 0 。 |
external_table_name | char(136) | 外部表扫描的表的外部名称的名称内部格式。 |
file_format | character(16) | 外部表数据的文件格式。 |
is_partitioned | char(1) | 如果为 true (t ),则此列值表示外部表已进行分区。 |
is_rrscan | char(1) | 如果为 true (t ),则此列值表示已应用限制范围的扫描。 |
is_nested | char(1) | 如果为 true (t ),该列值表示访问嵌套的列数据类型。 |
s3_scanned_rows | bigint | 已从 Amazon S3 扫描并发送到 Redshift Spectrum 层的行数量。 |
s3_scanned_bytes | bigint | 已从 Amazon S3 扫描并发送到 Redshift Spectrum 层的基于压缩数据的字节的数量。 |
s3query_returned_rows | bigint | 已从 Redshift Spectrum 层返回到集群的行的数量。 |
s3query_returned_bytes | bigint | 已从 Redshift Spectrum 层返回到集群的字节的数量。返回到 Amazon Redshift 的大量数据可能会影响系统性能。 |
files | integer | 针对此 Redshift Spectrum 查询已处理的文件的数量。文件数量少会限制并行处理的优势。 |
files_max | integer | 在一个切片上处理的最大文件数。 |
files_avg | integer | 在一个切片上处理的平均文件数。 |
splits | int | 为此分段处理的拆分数。在此切片上处理的拆分数。对于大型可拆分数据文件(例如,大于 512 MB 左右的数据文件),Redshift Spectrum 会尝试将文件拆分为多个 S3 请求以便进行并行处理。 |
splits_max | int | 在此切片上处理的最大拆分数。 |
splits_avg | int | 在此切片上处理的平均拆分数。 |
total_split_size | bigint | 处理的所有拆分的总大小。 |
max_split_size | bigint | 处理的最大拆分大小(以字节为单位)。 |
avg_split_size | bigint | 处理的平均拆分大小(以字节为单位)。 |
total_retries | integer | 单个处理文件的最大重试次数。 |
max_retries | integer | 任何已处理文件的最大重试次数。 |
max_request_duration | integer | 单个文件请求的最长持续时间(以微秒为单位)。长时间运行的查询可能表示瓶颈。 |
avg_request_duration | double precision | 文件请求的平均持续时间(以微秒为单位)。 |
max_request_parallelism | integer | 该 Redshift Spectrum 查询的一个切片中的最大并行请求数。 |
avg_request_parallelism | double precision | 该 Redshift Spectrum 查询的一个切片中的平均并行请求数。 |
total_slowdown_count | bigint | 在外部表扫描期间出现减速错误的总 Amazon S3 请求数。 |
max_slowdown_count | integer | 在一个切片上的外部表扫描期间出现减速错误的最大 Amazon S3 请求数。 |
示例查询
以下示例获取上次完成的查询的扫描步骤详细信息。
select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svl_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files ------+---------+---------+-----------------+------------------+-----------------------+------------------------+------ 4587 | 2 | 67811 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 591568 | 172462 | 11260097 | 8513 | 170260 | 1 4587 | 2 | 216849 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 216671 | 0 | 0 | 0 | 0 | 0