STL_FILE_SCAN - Amazon Redshift

STL_FILE_SCAN

Retorna os arquivos que o Amazon Redshift leu ao carregar dados usando o comando COPY.

Consultar esta visualização pode ajudar a solucionar erros de carregamento de dados. STL_FILE_SCAN pode ser particularmente útil para identificar problemas em carregamentos de dados paralelos, porque carregamentos de dados paralelos normalmente carregam muitos arquivos com um único comando COPY.

STL_FILE_SCAN permanece visível para todos os usuários. Os superusuários podem ver todas as linhas; usuários regulares podem ver somente seus próprios dados. Para ter mais informações, consulte Visibilidade de dados em tabelas e visualizações de sistema.

nota

STL_FILE_SCAN só contém consultas executadas em clusters principais. Ele não contém consultas executadas em clusters de escalabilidade de simultaneidade. Para acessar consultas executadas em clusters de escalabilidade principais e de simultaneidade, é recomendável usar a exibição de monitoramento SYS SYS_LOAD_DETAIL. Os dados na exibição de monitoramento SYS são formatados para serem mais fáceis de usar e compreender.

Colunas da tabela

Nome da coluna Tipo de dados Descrição
userid inteiro O ID do usuário que gerou a entrada.
consulta inteiro ID da consulta. A coluna de consulta pode ser usada para unir outras tabelas e exibições do sistema.
slice inteiro O número que identifica a fatia em que a consulta estava sendo executada.
name character(90) O caminho completo e o nome do arquivo que foi carregado.
lines bigint O número de linhas lidas do arquivo.
bytes bigint O número de bytes lidos do arquivo.
loadtime bigint O tempo gasto no carregamento do arquivo (em microssegundos).
curtime Timestamp Timestamp que representa a hora em que o Amazon Redshift começou a processar o arquivo.
is_parcial inteiro Valor que, se true (1), indica que o arquivo de entrada é dividido em intervalos durante uma operação COPY. Se esse valor for false (0), o arquivo de entrada não será dividido.
start_offset bigint Valor que, se o arquivo de entrada for dividido durante uma operação COPY, indica o valor de deslocamento da divisão (em bytes). Se o arquivo não estiver dividido, esse valor será 0.

Consultas de exemplo

A consulta a seguir recupera os nomes e tempos de carregamento de todos os arquivos que o Amazon Redshift levou mais de 1.000.000 de microssegundos para ler.

select trim(name)as name, loadtime from stl_file_scan where loadtime > 1000000;

Essa consulta retorna os dados de saída de exemplo a seguir.

name | loadtime ---------------------------+---------- listings_pipe.txt | 9458354 allusers_pipe.txt | 2963761 allevents_pipe.txt | 1409135 tickit/listings_pipe.txt | 7071087 tickit/allevents_pipe.txt | 1237364 tickit/allusers_pipe.txt | 2535138 listings_pipe.txt | 6706370 allusers_pipe.txt | 3579461 allevents_pipe.txt | 1313195 tickit/allusers_pipe.txt | 3236060 tickit/listings_pipe.txt | 4980108 (11 rows)