スキップされた行のエラーのトラブルシューティング - Amazon QuickSight

スキップされた行のエラーのトラブルシューティング

データをインポートすると、Amazon QuickSight ではデータの一部がプレビューされます。何らかの理由で行を解釈できない場合、その行はスキップされます。

幸いなことに、エラーになる可能性があるものは限られています。次のような例を認識しておくことで、問題は回避できます。

  • フィールドのデータ型とフィールドデータとの間に矛盾がないことを確認します。例えば、数値データ型のフィールドに、文字列データが発生することが時折あります。テーブルの内容をスキャンする際に検出が困難になる可能性がある例を以下に挙げます。

    • '' — 欠損値を示すために空の文字列を使用している

    • 'NULL' — 欠損値を示すために「null」という単語を使用している

    • $1000 — 通貨値に含めたドル記号が文字列に変換されている

    • 'O'Brien' — 句読点を含む文字列をマークするために同じ句読点を使用している。

    ただし、この種のエラーが必ずしも見つけやすいわけではありません。特に、データが大量である場合や手作業で入力されている場合などです。例えば、顧客サービスや販売用アプリケーションの中には、顧客に口頭で情報を入力させるものがあります。最初にデータを入力した人は、間違ったフィールドに入力しているかもしれません。彼らは、文字や数字を追加したり、あるいは追加するのを忘れたりするかもしれません。例えば、日付を「0/10/12020」と入力したり、年齢のフィールドに性別を入力したりするかもしれません。

  • インポートしたファイルが、ヘッダーの有無にかかわらず正しく処理されていることを確認します。ヘッダー行がある場合は、アップロードのオプションで [Contains header (ヘッダーが含まれています)] を選択します。

  • データが 1 つまたは複数の データソースのクォータ を超えていないことを確認します。

  • データが、サポートされているデータ型と値 と互換性があることを確認します。

  • 計算フィールドに、計算フィールドの関数と互換性がないデータやそこから除外されたデータではなく、計算と連動するデータが含まれていることを確認します。例えば、データセットに parseDate を使用している計算フィールドがある場合、QuickSight は、そのフィールドに有効な日付が含まれていなければ行をスキップします。

QuickSight は、SPICE エンジンによるデータの取り込み試行時に発生するエラーの詳細なリストを提供します。保存されたデータセットがスキップされた行を報告するときエラーが表示されるので、ユーザーは問題修正のアクションをとることができます。

SPICE 取り込み (データのインポート) 中にスキップされた行のエラーを表示する

  1. データセットのページで、問題のあるデータセットを選択し、その情報と設定を表示します。

  2. [View error summary (エラーの概要を表示)] を選択します。このリンクは、データセットのインポート情報とスキップされた行数の下にあります。

    
					        [View error summary (エラーの概要を表示)] を赤色でハイライトしたデータセットのインポート概要の画像。
  3. 開いた [File import log (ファイルインポートログ)] を確認します。以下のセクションが表示されます。

    • Summary (概要) - インポートの際、行の合計数のうち何行がスキップされたか、そのスコアをパーセンテージで示します。例えば、合計 1,728 行のうち 864 行がスキップされた場合、スコアは 50.00% になります。

    • Skipped Rows (スキップされた行) - 類似したスキップされた行のセットごとに、行数、フィールド名、およびエラーメッセージを示します。

    • Troubleshooting (トラブルシューティング) — エラー情報を含むファイルをダウンロードするためのリンクを示します。

  4. [Troubleshooting (トラブルシューティング)] の下で、[Download error rows file (エラー行ファイルをダウンロード)] を選択します。

    エラーファイルには、各エラーに行があります。ファイルは error-report_123_fe8.csv と命名され、123_fe8 は一意の識別文字列に置き換えられます。このファイルには次の列が含まれます。

    • ERROR_TYPE — この行をインポートしたときに発生したエラーの型またはエラーコードです。このエラーは、本手順の次の SPICE 取り込みエラーコード のセクションで確認できます。

    • COLUMN_NAME — エラーの原因となった、データ内の列の名前です。

    • インポートした行のすべての列 — 残りの列は、データの行全体を複製します。行に複数のエラーが含まれていると、このファイルにそれが複数回現れることがあります。

  5. データセットを変更するには、[Edit data set (データセットの編集)] を選択します。データのフィルタリング、フィールドの省略、データ型の変更、既存の計算フィールドの調整、データを検証するための計算フィールドの追加、などが行えます。

  6. エラーコードで示された変更を行ったら、再度データをインポートします。ログに SPICE 取り込みのエラーがまだ表示される場合は、この手順を再度実行し、残りのエラーをすべて修正します。

ヒント

データセットエディタを使用して合理的な時間内にデータの問題を解決できない場合は、データを所有している管理者またはデベロッパーに問い合わせてください。長期的にみると、分析のためにデータを準備している間に例外処理を追加するよりも、ソースに近いデータをクレンジングする方が、費用対効果は高くなります。ソースで修正すれば、複数のユーザーが異なる方法でエラーを修正し、その後異なるレポート結果が生じる状況を回避できます。

スキップされた行のトラブルシューティングを練習するには

  1. をダウンロードします。。CSV files for troubleshooting skipped rows.zip

  2. サンプルの .csv ファイルを QuickSight にアップロードする際に使用するフォルダに、ファイルを抽出します。

    この zip ファイルには、次の 2 つのテキストファイルが含まれています。

    • sample dataset - data ingestion error.csv – 行がスキップされる原因となる問題が含まれたサンプル .csv ファイル。自分でファイルをインポートし、エラープロセスの仕組みを確認することができます。

    • sample data ingestion error file – サンプル .csv ファイルを QuickSight にインポートする間の SPICE 取り込み中に生成されたサンプルエラーファイル。

  3. 次の手順に従って、データをインポートします。

    1. [Datasets (データセット)]、[New dataset (新しいデータセット)] の順に選択します。

    2. [Upload a file] (ファイルのアップロード) を選択します。

    3. sample dataset - data ingestion error.csv という名前のファイルを見つけ、選択します。

    4. [Upload a file (ファイルのアップロード)]、[Edit settings and prepare data (設定の編集とデータの準備)] の順に選択します。

    5. [Save (保存)] を選択して終了します。

  4. データセットを選択して情報を表示し、[View error summary (エラーの概要を表示)] を選択します。エラーとデータを調べ、問題解決に役立てます。