Amazon Keyspaces と Apache Spark の統合 - Amazon Keyspaces (Apache Cassandra 向け)

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Keyspaces と Apache Spark の統合

Apache Spark は、大規模データ分析のためのオープンソースエンジンです。Apache Spark では、Amazon Keyspaces に保存されているデータの分析を効率的に実行できます。Amazon Keyspaces を利用すれば、Spark からの分析データへの一貫した 1 桁ミリ秒単位の読み取りアクセスをアプリケーションに提供することもできます。オープンソースの Spark Cassandra コネクタがあれば、Amazon Keyspaces と Spark 間でデータの読み取りや書き込みが簡単にできます。

Amazon Keyspaces は Spark Cassandra コネクタをサポートしています。そのため、フルマネージドのサーバーレスデータベースサービスで、Spark ベースの分析パイプラインで効率的に Cassandra ワークロードを実行できます。Amazon Keyspaces があれば、Spark で、テーブルと同じ基盤インフラストラクチャリソースをめぐって競合の心配をする必要がなくなります。Amazon Keyspaces テーブルでは、アプリケーションのトラフィックに基づいて拡大、縮小が行われます。

以下のチュートリアルでは、Spark Cassandra コネクタで Amazon Keyspaces にデータを読み書きするために必要な手順とベストプラクティスについて説明します。このチュートリアルでは、Spark Cassandra コネクタでファイルからデータを読み込み、Amazon Keyspaces テーブルに書き込んで、Amazon Keyspaces にデータを移行する方法を示します。次に、このチュートリアルでは、Spark Cassandra コネクタで Amazon Keyspaces からデータを読み取る方法を説明します。この方法で、Spark ベースの分析パイプラインで Cassandra ワークロードを実行できます。