使用寫入碎片跨分割區平均分配工作負載

在 Amazon Keyspaces 中跨分割區更好地分配寫入的一個方法是擴展空間。您可以數種不同的方式來執行此動作：您可以新增額外的分割區索引鍵資料欄，您可以將隨機數字寫入其中，以在分割區之間分配資料列。或者，您可以使用根據您查詢內容計算的數字。

使用複合分割區索引鍵和隨機值的碎片

跨分割區更平均分配負載的一個策略是新增一個額外的分割區索引鍵資料欄，以便您寫入隨機數字。如此您就能在較大的空間中將寫入隨機化。

例如，請考慮下表，其具有代表日期的單一分割區索引鍵。


CREATE TABLE IF NOT EXISTS tracker.blogs (
   publish_date date,
   title text,
   description int,
   PRIMARY KEY (publish_date));

若要跨分割區更平均地分配此資料表，您可以包含存放shard隨機數字的額外分割區索引鍵資料欄。例如：


CREATE TABLE IF NOT EXISTS tracker.blogs (
   publish_date date, 
   shard int, 
   title text, 
   description int, 
   PRIMARY KEY ((publish_date, shard)));

插入資料時，您可以在 1和之間200為資料shard欄選擇隨機數字。這會透過產生複合分割區索引鍵值，例如 (2020-07-09, 1)、 (2020-07-09, 2)等(2020-07-09, 200)。因為您隨機化了分割區索引鍵，每天對資料表的寫入會平均分配在多個分割區中。這可帶來更優良的平行處理與更高的整體傳輸量。

不過，若要讀取指定日期的所有資料列，您必須查詢所有碎片的資料列，然後合併結果。例如，您會先發出分割區索引鍵值的SELECT陳述式(2020-07-09, 1)。然後(2020-07-09, 2)，透過為發出另一個SELECT陳述式，以此類推(2020-07-09, 200)。最後，您的應用程式必須合併所有這些SELECT陳述式的結果。

使用複合分割區索引鍵和計算值的碎片

隨機化的策略可大幅改善寫入傳輸量。但讀取特定資料列並不容易，因為您不知道在資料列寫入時將哪個值寫入資料shard欄。若要更輕鬆地讀取個別資料列，您可以使用不同的策略。不是使用隨機數字在分割區之間分配資料列，而是使用您可以根據要查詢的內容來計算的數字。

考量先前的範例，其中資料表會使用分割區索引鍵中的今天日期。現在假設每一列都有可存取的資料title欄，而且除了日期之外，您通常還需要依標題尋找資料列。在應用程式將資料列寫入資料表之前，它可以根據標題計算雜湊值，並使用它來填入資料shard欄。計算應會產生介於 1 到 200 之間的數字，此分佈非常平均，與隨機策略產生的結果相當類似。

簡單計算可能就足夠，例如標題模數 200、+ 1 中字元的 UTF-8 程式碼點值乘積。然後，複合分割區索引鍵值會是日期和計算結果的組合。

有了這項策略，即可在分割區索引鍵值之間，以及實體分割區之間平均分配寫入。您可以輕鬆為特定資料列和日期執行SELECT陳述式，因為您可以計算特定值的分割區索引鍵title值。

若要讀取指定日期的所有資料列，您仍然必須SELECT每個(2020-07-09, N)金鑰（其中 N為 1–200)，然後您的應用程式必須合併所有結果。好處是您能避免讓單一「經常性」分割區索引鍵值承受所有工作負載。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

分割區索引鍵設計

成本最佳化