其他主題 - Amazon DynamoDB

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

其他主題

下列是使用 Hive 存取 DynamoDB 來調整應用程式的一些更多方法。

Retry duration (重試持續時間)

依預設,如果 Hive 未在兩分鐘內從 DynamoDB 傳回任何結果,Hive 將會重新執行 Hadoop 任務。您可以藉由修改 dynamodb.retry.duration 參數來調整此間隔:

SET dynamodb.retry.duration=2;

此值必須是非零的整數,代表重試間隔中的分鐘數。dynamodb.retry.duration 預設值為 2 (分鐘)。

平行資料請求

針對單一資料表的多個資料請求,無論是來自一名以上的使用者還是一個以上的應用程式,都會耗盡讀取佈建輸送量,降低效能。

處理持續時間

DynamoDB 中的資料一致性取決於每個節點讀取和寫入操作的順序。當 Hive 查詢正在進行中時,另一個應用程式可以將新資料載入 DynamoDB 資料表,或修改或刪除現有的資料。在此案例中,Hive 查詢的結果有可能無法反映執行查詢的過程中所做的資料變更。

請求時間

當對 DynamoDB 資料表的需求較低時,排程存取 DynamoDB 資料表的 Hive 查詢可改善效能。例如,若您大多數的應用程式使用者住在舊金山,您可以選擇在大多數的使用者仍在睡眠中的太平洋標準時間 (PST) 早上 4 點匯出每日資料,而不更新您 DynamoDB 資料庫中的紀錄。