本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
可靠性支柱
可靠性支柱包括工作负载在预期时正确、一致地执行其预期功能的能力。这包括能够在工作负载的整个生命周期中对其进行操作和测试。
配置可靠的工作负载始于软件和基础架构的前期设计决策。您的架构选择将影响所有 Well-Architected 支柱的工作负载行为。要实现可靠性,必须遵循特定的模式。
可靠性支柱侧重于以下关键领域:
-
工作负载架构,包括服务配额和部署模式
-
管理和扩展 InfluxDB 实例
工作负载架构,包括服务配额和部署模式
每个 AWS 账户 都有各自提供的资源配额 AWS 区域。例如,无论实例大小如何,每个区域都有 InfluxDB实例的时间流配额。达到某个区域中的最大实例数后,创建实例的其他调用会失败,但会出现异常。InfluxDB 实例存储卷的时间流可以增加到所有支持的最大大小为 16 太字节 () TiBs。 AWS 区域
部署模式
要为 InfluxDB 实例的 Timestream 提供高可用性和故障转移支持,您可以将多可用区部署与单个备用数据库实例一起使用。这种类型的部署称为多可用区数据库实例部署。适用于 InfluxDB 的 Amazon Timestream 使用亚马逊故障转移技术。在多可用区数据库实例部署中,Amazon Timestream 会自动在不同的可用区域预配置和维护同步备用副本。为了提供数据冗余,主数据库实例跨可用区同步复制到备用副本。
运行具有高可用性的数据库实例可以在数据库实例故障或可用区中断期间提供可用性。如果您的数据库实例因基础设施缺陷而导致计划外中断,则适用于 InfluxDB 的 Amazon Timestream 会自动切换到备用副本。完成失效转移所用的时间取决于在主数据库实例变为不可用时的数据库活动和其他条件。
故障转移时间通常为 60–120 秒。但是,具有高基数数据的大型事务或具有预热要求的漫长恢复过程可能会增加故障转移时间。故障转移完成后,可能需要更多时间才能让 Timestream 控制台反映新的可用区。
如果您的应用程序在完全 AWS 区域 中断期间必须保持可用,请考虑在灾难恢复 (DR) 计划中设置复制或写入其他区域。但是,在设置复制之前,请务必了解这些限制。有关更多信息,请参阅 InfluxDB 文档
适用于 InfluxDB 的 Amazon Timestream 会定期进行内部备份并将其保留 24 小时,以支持可用性和耐久性。快照是在删除期间拍摄的,并保留 30 天以支持恢复。要访问或使用这些内容,请在上创建案例AWS 支持
管理和扩展 InfluxDB 的时间流
InfluxDB 的 Timestream 支持非常适合在开源 InfluxDB 数据库中运行内存密集型工作负载的实例类。不同的 db.influx 实例类对 v CPUs、内存、存储和网络带宽都有限制。要选择符合应用程序写入和查询延迟要求的实例类,请在测试期间遵守 Amazon CloudWatch CPUUtilization
和DiskUtilization
指标。MemoryUtilization
您可以根据工作负载要求向上和向下扩展实例。InfluxDB 的 Timestream 提供了多个存储层,这些存储层已预先配置为不同类型的工作负载所需的最佳 IOPS 和吞吐量。根据您的要求选择最适合您的工作负载的内容。
如果您的扩展需求在可预测的时间发生变化,则可以使用AWS Lambda 函数或自定义调度程序并运行 API 或 SDK 以在缓冲时间内向上和向下扩展。
你可以使用参数组中的参数在 InfluxDB 的 Timestream 中管理你的 InfluxDB 配置。参数组充当应用于一个或多个数据库实例的 InfluxDB 配置选项的容器。修改参数组中的参数时,要了解静态参数和动态参数之间的区别,以及如何和何时应用它们。要查看当前应用的配置,请使用 GetDbParameterGroupAPI 操作。