對資料列被略過的錯誤進行疑難排解 - Amazon QuickSight

重要事項:我們重新設計了 Amazon QuickSight 分析工作區。您可能會遇到無法反映 QuickSight 主控台中新外觀的螢幕擷取畫面或程序文字。我們正在更新螢幕擷取畫面和程序文字。

若要尋找功能或項目,請使用快速搜尋列

有關新外觀 QuickSight的更多信息,請參閱在 Amazon 上引入新的分析體驗 QuickSight

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

對資料列被略過的錯誤進行疑難排解

匯入資料時,Amazon 會 QuickSight 預覽部分資料。如果因為任何原因而無法解譯某個資料列,則會略過該資料列。

幸好可能出錯的地方數量有限。透過了解以下範例可以避免一些問題:

  • 確保欄位資料類型和欄位資料 (例如:數值資料類型欄位中偶爾出現的字串資料) 之間的一致。以下是掃描資料表內容時很難偵測到的一些問題的範例:

    • '':使用空字串來指示缺失值

    • 'NULL':使用單字 "null" 來指示缺失值

    • $1000:在貨幣值中包含美元符號會將其轉換為字串

    • 'O'Brien':使用標點符號來標記包含所用標點符號的字串。

    然而,這些類型的錯誤並不永遠容易發現,特別是如果資料量大,或者資料手動輸入。例如,某些客戶服務或銷售應用程式涉及輸入客戶口頭提供的資訊。最初輸入資料的人可能將資料輸入到了錯誤的欄位。他們可能會新增或忘記新增字元或數字。例如,他們可能會輸入日期 "0/10/12020" 或在代表年齡的欄位中輸入某人的性別。

  • 確認您匯入的有標頭或沒有標頭的檔案已正確處理。如果有標頭資料列,請確認選擇包含標頭上傳選項。

  • 確認資料不超出 資料來源配額 中的一個或多個。

  • 確認資料與 支援的資料類型和值 相容。

  • 確認計算欄位包含可用於計算的資料,不會與計算欄位中的函數不相容或被計算欄位中的函數排除。例如,如果您的資料集中有使用的計算欄位parseDate,則會 QuickSight 略過該欄位不包含有效日期的列。

QuickSight 提供SPICE引擎嘗試擷取資料時發生的錯誤的詳細清單。當已儲存的資料集報告略過資料列時,您可以檢視錯誤,以便採取措施修復問題。

檢視 SPICE 擷取 (資料匯入) 期間略過資料列錯誤
  1. 資料集頁面上,選擇有問題的資料集將其開啟。

  2. 在開啟的資料集詳細資訊頁面上,選擇重新整理索引標籤。

    SPICE 擷取歷史記錄便會顯示在底部。

  3. 針對出現錯誤的擷取,選擇檢視錯誤摘要。此連結位於狀態資料欄下。

  4. 檢查開啟的檔案匯入日誌。它顯示以下區段:

    • 摘要:提供匯入中略過的總列數的百分比分數。例如,如果總共 1,728 列中有 864 列被略過,則分數為 50.00%。

    • 已略過的資料列:提供每組相似略過列的列計數、欄位名稱和錯誤訊息。

    • 疑難排解:提供下載包含錯誤訊息之檔案的連結。

  5. 疑難排解下,選擇下載錯誤資料列檔案

    錯誤檔案中的每個錯誤都有一列。該檔案名為 error-report_123_fe8.csv,其中 123_fe8 會被唯一識別字串取代。該檔案內含以下資料欄:

    • ERROR_TYPE:匯入資料列時發生的錯誤的類型或錯誤代碼。您可以在本程序之後的 SPICE 擷取錯誤代碼 一節中查閱錯誤的相關資訊。

    • COLUMN_NAME:資料中導致錯誤的資料欄的名稱。

    • 匯入資料列中的所有資料欄:剩餘資料欄重複整列資料。如果一列有多個錯誤,則它可能會在此檔案中出現多次。

  6. 選擇編輯資料集變更資料集。您可以篩選資料、省略欄位、變更資料類型、調整現有計算欄位,以及新增驗證資料的計算欄位。

  7. 進行錯誤代碼指示的變更後,再次匯入資料。如果日誌中出現其他 SPICE 擷取錯誤,請再次執行此程序以修復所有剩餘錯誤。

提示

如果使用資料集編輯器無法在合理的時間內解決資料問題,請諮詢擁有資料的管理員或開發人員。從長遠來看,在更接近資料來源的地方清理資料,比在準備資料以用於分析時進行例外狀況處理更具成本效益。透過從來源修正錯誤,可以避免多人以不同方式修正錯誤,從而導致稍後報告結果不同的情況。

練習對資料列被略過進行疑難排解
  1. 下載 CSV files for troubleshooting skipped rows.zip

  2. 將檔案解壓縮至資料夾,以便將範例 .csv 檔案上傳至該資料夾。QuickSight

    該 zip 檔案包含下列兩個文字檔案:

    • sample dataset - data ingestion error.csv:範例 .csv 檔案,其中包含導致略過資料列的問題。您可以嘗試自行匯入該檔案,看看錯誤處理是如何進行的。

    • sample data ingestion error file— SPICE 擷取期間所產生的範例錯誤檔案,同時將範例 .csv 檔案匯入。 QuickSight

  3. 請依照下列步驟匯入資料:

    1. 選擇資料集,再選擇新增資料集

    2. 選擇 Upload a file (上傳檔案)

    3. 找到並選擇名為 sample dataset - data ingestion error.csv 的檔案。

    4. 選擇上傳檔案,再選擇編輯設定和準備資料

    5. 選擇儲存以退出。

  4. 選擇資料集以檢視其訊息,然後選擇檢視錯誤摘要。檢查錯誤和資料以解決問題。