性能优化 - Amazon DynamoDB

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

性能优化

创建映射到 DynamoDB 表的 Hive 外部表时,不占用 DynamoDB 的任何读取或写入容量。但是,Hive 表的读取和写入操作(如 INSERTSELECT)直接转换为对底层 DynamoDB 表的读取和写入操作。

Amazon EMR 的 Apache Hive 采用自己的逻辑平衡 DynamoDB 表的 I/O 负载,尽可能减少超出表预置吞吐量的可能。每个 Hive 查询结束时,Amazon EMR 返回运行时指标,包括超出预置吞吐量的次数。可以使用这些信息以及 DynamoDB 表的 CloudWatch 指标,在后续请求中提高性能。

Amazon EMR 控制台为集群提供基本监控工具。有关更多信息,请参见 Amazon EMR 管理指南查看和监控集群

还可以使用基于 Web 的工具(例如 Hue、Ganglia 和 Hadoop Web 界面)监控集群和 Hadoop 任务。有关更多信息,请参见 Amazon EMR g管理指南查看 Amazon EMR 集群上托管的 Web 界面

本节介绍调整外部 DynamoDB 表的 Hive 操作性能可以采取的步骤。