步驟 3:執行 AWS Glue 任務,將 Amazon Keyspaces 資料表從 匯出至 Amazon S3 儲存貯體 AWS CLI - Amazon Keyspaces (適用於 Apache Cassandra)

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

步驟 3:執行 AWS Glue 任務,將 Amazon Keyspaces 資料表從 匯出至 Amazon S3 儲存貯體 AWS CLI

在此步驟中,您可以使用 AWS CLI 執行在上一個步驟中建立 AWS Glue 的任務,將 Amazon Keyspaces 資料表匯出至 Amazon S3 中的儲存貯體。

從 執行匯出任務 AWS CLI
  1. 在下列範例中, AWS CLI 命令會執行在上一個步驟中建立的任務。

    aws glue start-job-run --job-name AmazonKeyspacesExportToS3-cfn-setup-cfn-glue
    • 您可以覆寫任何 AWS Glue 任務參數,包括 AWS CLI 命令中的預設引數。若要覆寫任務的任何預設引數,例如鍵空間或資料表名稱,您可以將它們做為引數傳遞。如需引數的完整清單,請參閱《 AWS Glue 命令列參考》中的 start-job-run

      下列命令會執行 AWS Glue 匯出任務,但會覆寫 AWS Glue 工作者數量、工作者類型和資料表名稱。

      aws glue start-job-run --job-name AmazonKeyspacesExportToS3-cfn-setup-cfn-glue \ --number-of-workers 8 --worker-type G.2X \ --arguments '{"--TABLE_NAME":"my_table"}'
  2. 確認您的資料表已匯出至 Amazon S3 儲存貯體。根據資料表的大小,這可能需要一些時間。匯出任務完成後,您可以使用範例命令在儲存貯體中看到下列資料夾。

    aws s3 ls s3://s3-keyspaces

    輸出會在您的儲存貯體中顯示下列結構。

    PRE conf/ PRE export/ PRE jars/ PRE scripts/ PRE spark-logs/

    您的檔案將位於 下的下列資料夾結構中export,資料/時間值會顯示您自己的值。

    \------- export \----- keyspace_name \----- table_name \----- snapshot \----- year=2025 \----- month=01 \----- day=02 \----- hour=09 \----- minute=22 \--- YOUR DATA HERE

若要排程您剛手動執行 AWS Glue 的任務,請繼續 步驟 4:(選用) 建立觸發以排程匯出任務