教學課程:使用 DSBulk 將資料載入 Amazon Keyspaces - Amazon Keyspaces (適用於 Apache Cassandra)

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

教學課程:使用 DSBulk 將資料載入 Amazon Keyspaces

本 step-by-step 教程指導您完成從阿帕奇卡桑德拉遷移數據到 Amazon Keyspaces 使用 DataStax 批量加載器 (DSBulk) 上可用. GitHub 使用 DSBulk 有助於將資料集上傳至 Amazon Keyspaces,以供學術或測試用途使用。如需如何移轉生產工作負載的詳細資訊,請參閱離線遷移過程:阿帕奇卡桑德拉到 Amazon Keyspaces。在此自學課程中,您將完成下列步驟。

必要條件 — 設定具有認證的 AWS 帳戶、為憑證建立 JKS 信任存放區檔案、設定cqlsh、下載和安裝 DSBulk,以及設定檔案。application.conf

  1. 建立來源 CSV 和目標資料表 — 準備 CSV 檔案作為來源資料,並在 Amazon 金鑰空間中建立目標 Keyspaces 間和表格。

  2. 準備資料 — 隨機化 CSV 檔案中的資料並對其進行分析,以決定平均和最大列大小。

  3. 設定輸送量容量 — 根據資料大小和所需的載入時間計算所需的寫入容量單位 (WCU),並設定表格的佈建容量。

  4. 配置 DSBulk 設置 — 創建帶有諸如身份驗證,SSL/TLS,一致性級別和連接池大小等設置的 DSBulk 配置文件。

  5. 執行 DSBulk 載入命令 — 執行 DSBulk 載入命令,將資料從 CSV 檔案上傳至 Amazon Keyspaces 表格,並監控進度。