本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
可靠性支柱
可靠性支柱包含工作負載在預期情況下正確且一致地執行其預期功能的能力。這包括在整個生命週期中操作和測試工作負載的能力。
設定可靠的工作負載從軟體和基礎設施的前期設計決策開始。您的架構選擇會對所有 Well-Architected 支柱的工作負載行為產生影響。若要實現可靠性,您必須遵循特定模式。
可靠性支柱著重於下列關鍵領域:
-
工作負載架構,包括服務配額和部署模式
-
管理和擴展 InfluxDB 執行個體
工作負載架構,包括服務配額和部署模式
每個 AWS 帳戶 都有每個 中提供的資源配額 AWS 區域。例如,無論執行個體大小為何,每個區域都有適用於 InfluxDB 執行個體的 Timestream 配額。在您達到區域中的執行個體數量上限後,建立執行個體的額外呼叫會失敗,但有例外。在所有支援的 中,InfluxDB 執行個體儲存磁碟區 Timestream 的大小上限為 16 TB (TiBs) AWS 區域。
部署模式
如需 Timestream for InfluxDB 執行個體的高可用性和容錯移轉支援,您可以使用多可用區域部署搭配單一待命資料庫執行個體。這種類型的部署稱為多可用區域資料庫執行個體部署。Amazon Timestream for InfluxDB 使用 Amazon 容錯移轉技術。在多可用區域資料庫執行個體部署中,Amazon Timestream 會自動在不同的可用區域中佈建和維護同步待命複本。為了提供資料備援,主要資料庫執行個體會跨可用區域同步複寫至待命複本。
在資料庫執行個體故障或可用區域中斷期間,執行高可用性的資料庫執行個體可提供可用性。如果因基礎設施瑕疵而導致資料庫執行個體意外中斷,Amazon Timestream for InfluxDB 會自動切換到待命複本。完成容錯移轉所需的時間取決於主要資料庫執行個體失效時的資料庫活動和其他條件。
通常容錯移轉時間是 60–120 秒。不過,具有高基數資料的大型交易或具有暖機前需求的冗長復原程序,可能會增加容錯移轉時間。容錯移轉完成後,在 Timestream 主控台反映新的可用區域之前,可能需要額外的時間。
如果您的應用程式必須在完全 AWS 區域 中斷期間保持可用,請考慮在災難復原 (DR) 計畫中設定複寫或寫入不同的區域。不過,在設定複寫之前,請確定您了解限制。如需詳細資訊,請參閱 InfluxDB 文件
Amazon Timestream for InfluxDB 會定期進行內部備份,並保留 24 小時以支援可用性和耐久性。快照會在刪除期間拍攝,並保留 30 天以支援還原。若要存取或使用它們,請在 建立案例AWS 支援
管理和擴展 InfluxDB 的 Timestream
InfluxDB 的 Timestream 支援執行個體類別,非常適合在開放原始碼 InfluxDB 資料庫中執行記憶體密集型工作負載。不同的 db.influx 執行個體類別對 vCPUs、記憶體、儲存體和網路頻寬都有限制。若要選擇符合您應用程式寫入和查詢延遲要求的執行個體類別,請在測試期間觀察 Amazon CloudWatch MemoryUtilization
CPUUtilization
、 和 DiskUtilization
指標。您可以根據工作負載需求來擴展和縮減執行個體。InfluxDB 的 Timestream 提供多個儲存層,這些儲存層預先設定了不同類型的工作負載所需的最佳 IOPS 和輸送量。根據您的需求,選擇最適合您工作負載的項目。
如果您的擴展需要在可預測的時間變更,您可以使用 AWS Lambda 函數或自訂排程器,並執行 API 或 SDK,以利用一些緩衝時間進行擴展和縮減。
您可以使用參數群組中的參數,在 Timestream for InfluxDB 中管理您的 InfluxDB InfluxDB 組態。參數群組可做為 InfluxDB 組態選項的容器,這些選項會套用至一或多個資料庫執行個體。修改參數群組中的參數時,請了解靜態和動態參數之間的差異,以及套用它們的方式和時間。若要查看目前套用的組態,請使用 GetDbParameterGroup API 動作。