步驟 4：準備 Amazon Keyspaces 中的來源資料和目標資料表

在此步驟中，您會使用範例資料和 Amazon Keyspaces 資料表建立來源檔案。

建立來源檔案。您可以選擇下列其中一個選項：
- 在本教學課程中，您會使用逗號分隔值 (CSV) 檔案，其名稱keyspaces_sample_table.csv為資料遷移的來源檔案。提供的範例檔案包含名稱為之資料表的幾列資料book_awards。
  1. 下載以下封存檔案 samplemigration.zip 中包含的範例 CSV 檔案 (keyspaces_sample_table.csv)。解壓縮封存，並記下的路徑keyspaces_sample_table.csv。
- 如果您想要遵循自己的 CSV 檔案，將資料寫入 Amazon Keyspaces，請確定資料已隨機化。直接從資料庫讀取或匯出至一般檔案的資料通常由分割區和主索引鍵排序。將排序資料匯入 Amazon Keyspaces 可能會導致它寫入 Amazon Keyspaces 分割區的較小區段，這會導致流量分佈不均勻。這可能會導致效能較慢和錯誤率較高。
  
  相反地，隨機化資料有助於透過更均勻地跨分割區分配流量，來利用 Amazon Keyspaces 的內建負載平衡功能。您可以使用各種工具來隨機化資料。如需使用開放原始碼工具 Shuf 的範例，請參閱資料遷移教學步驟 2：使用 DSBulk 準備要上傳的資料中的。以下是示範如何以隨機播放資料的範例DataFrame。
```
import org.apache.spark.sql.functions.randval
shuffledDF = dataframe.orderBy(rand())
```
在 Amazon Keyspaces 中建立目標金鑰空間和資料表。
1. 使用連線至 Amazon Keyspacescqlsh-expansion。如需cqlsh-expansion安裝說明，請參閱使用 cqlsh-expansion 連線至 Amazon Keyspaces。
  
  將下列範例中的服務端點取代為您自己的值。
```
cqlsh-expansion cassandra.us-east-1.amazonaws.com 9142 --ssl
```
2. 建立名稱為的新金鑰空間catalog，如下列範例所示。
```
CREATE KEYSPACE catalog WITH REPLICATION = {'class': 'SingleRegionStrategy'};
```
3. 在新的金鑰空間狀態為可用之後，請使用下列程式碼來建立目標資料表 book_awards。若要進一步了解非同步資源建立以及如何檢查資源是否可用，請參閱檢查 Amazon Keyspaces 中的金鑰空間建立狀態。
```
CREATE TABLE catalog.book_awards (
   year int,
   award text,
   rank int, 
   category text,
   book_title text,
   author text, 
   publisher text,
   PRIMARY KEY ((year, award), category, rank)
   );
```

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

步驟 3：建立應用程式組態檔案

步驟 5：寫入和讀取 Amazon Keyspaces 資料