Tabel sistem untuk memecahkan masalah beban data - Amazon Redshift

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Tabel sistem untuk memecahkan masalah beban data

Tabel sistem Amazon Redshift berikut dapat membantu dalam memecahkan masalah pemuatan data:

  • Kueri STL_LOAD_ERRORS untuk menemukan kesalahan yang terjadi selama pemuatan tertentu.

  • Kueri STL_FILE_SCAN untuk melihat waktu muat untuk file tertentu atau untuk melihat apakah file tertentu bahkan dibaca.

  • Kueri STL_S3CLIENT_ERROR untuk menemukan detail untuk kesalahan yang ditemui saat mentransfer data dari Amazon S3.

Untuk menemukan dan mendiagnosis kesalahan beban
  1. Buat tampilan atau tentukan kueri yang mengembalikan detail tentang kesalahan pemuatan. Contoh berikut menggabungkan tabel STL_LOAD_ERRORS ke tabel STV_TBL_PERM untuk mencocokkan ID tabel dengan nama tabel yang sebenarnya.

    create view loadview as (select distinct tbl, trim(name) as table_name, query, starttime, trim(filename) as input, line_number, colname, err_code, trim(err_reason) as reason from stl_load_errors sl, stv_tbl_perm sp where sl.tbl = sp.id);
  2. Setel opsi MAXERRORS dalam perintah COPY Anda ke nilai yang cukup besar untuk mengaktifkan COPY untuk mengembalikan informasi yang berguna tentang data Anda. Jika COPY menemukan kesalahan, pesan kesalahan mengarahkan Anda untuk melihat tabel STL_LOAD_ERRORS untuk detailnya.

  3. Kueri tampilan LOADVIEW untuk melihat detail kesalahan. Sebagai contoh:

    select * from loadview where table_name='venue';
    tbl | table_name | query | starttime --------+------------+-------+---------------------------- 100551 | venue | 20974 | 2013-01-29 19:05:58.365391 | input | line_number | colname | err_code | reason +----------------+-------------+-------+----------+--------------------- | venue_pipe.txt | 1 | 0 | 1214 | Delimiter not found
  4. Perbaiki masalah dalam file input atau skrip pemuatan, berdasarkan informasi yang dikembalikan tampilan. Beberapa kesalahan pemuatan khas yang harus diperhatikan meliputi:

    • Ketidakcocokan antara tipe data dalam tabel dan nilai di bidang data input.

    • Ketidakcocokan antara jumlah kolom dalam tabel dan jumlah bidang dalam data input.

    • Tanda kutip yang tidak cocok. Amazon Redshift mendukung tanda kutip tunggal dan ganda; Namun, tanda kutip ini harus diseimbangkan dengan tepat.

    • Format yang salah untuk data tanggal/waktu dalam file input.

    • O ut-of-range nilai dalam file input (untuk kolom numerik).

    • Jumlah nilai yang berbeda untuk kolom melebihi batasan untuk pengkodean kompresi.