擷取資料 - AWS Supply Chain

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

擷取資料

如果您使用的是 Amazon S3,以下是擷取選項:

  • 附加 — 為了附加擷取資料或增量擷取,來源路徑中的所有檔案都會合併成單一資料集,然後才會擷取到資料湖中。此方法可確保跨越多天的文件數據的完整性。從 Amazon S3 儲存貯體的來源路徑中移除檔案時,系統會挑選僅在來源路徑中可用的檔案進行擷取,並將其導入資料湖中。加選項可確保 Amazon S3 中的檔案在資料湖中進行複寫和同步。

  • 覆寫 — 取代期間,資料檔案會在來源路徑中進行更新時擷取到資料湖中。每個新檔案都會完全取代資料集。

    注意

    您可以在「附加」和「覆寫」選項中刪除來源流程和對應的資料。

以下是 EDI SAP S/4 HANA 和 SAP ECC 的擷取作業選項:

  • 更新 — 使用方案中使用的相同欄位更新現有的資料列。

  • 取代 — 刪除現有的已上傳資料,並將其取代為新的傳入資料。

  • 刪除 — 使用主 ID 刪除一或多列資料。

若要開始資料擷取,請遵循下列程序:
  1. 在 AWS Supply Chain 儀表板窗格的左側導覽窗格上,選擇 [資料湖]。

  2. 在 [資料擷取] 索引標籤上,選擇 [連線]。

  3. 選取要擷取資料的連線,然後選擇「資料擷取」。

    便會顯示「資料擷取組態」頁面。

  4. 選擇開始使用

  5. 在「資料擷取詳細資料」頁面上,選取是否要更新、取刪除資料。選擇複製以複 Amazon S3 路徑。