使用 Amazon EMR 从 Kinesis Data Streams 读取数据 - Amazon Kinesis Data Streams

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon EMR 从 Kinesis Data Streams 读取数据

Amazon EMR 集群可以使用 Hadoop 生态系统中的熟悉工具(如 Hive、Pig、MapReduce、Hadoop Streaming API 和 Cascading)直接读取和处理 Kinesis 流。您还可以将 Kinesis Data Streams 中的实时数据与正在运行的集群中 Amazon S3、Amazon DynamoDB 和 HDFS 上的现有数据进行连接。您可以直接将 Amazon EMR 中的数据加载到 Amazon S3 或 DynamoDB 来进行后处理。

有关更多信息,请参阅《Amazon EMR Release Guide》中的 Amazon Kinesis