AWS のサービス における Athena との統合 - Amazon Athena

AWS のサービス における Athena との統合

Athena を使用して、このセクションにリストされている AWS のサービス からのデータをクエリできます。各サービスでサポートされるリージョンについては、「Amazon Web Services 全般のリファレンス」の「リージョンとエンドポイント」を参照してください。

各統合の詳細については、以下のセクションを参照してください。

AWS CloudFormation
キャパシティーの予約

参照トピック:「AWS CloudFormation ユーザーガイド」の「AWS::Athena::CapacityReservation

指定された名前と要求されたデータ処理単位の数で、キャパシティ予約を指定します。詳細については、「Amazon Athena ユーザーガイド」の「クエリ処理キャパシティを管理する」、および「Amazon Athena API リファレンス」の「CreateCapacityReservation」を参照してください。

データカタログ

リファレンストピック:「AWS CloudFormation ユーザーガイド」の「AWS::Athena::DataCatalog

名前、説明、型、パラメータ、およびタグを含めた Athena データカタログを指定します。詳細については、「Amazon Athena ユーザーガイド」の「Athena でのテーブル、データベース、およびデータカタログの理解」、および「Amazon Athena API リファレンス」の「CreateDataCatalog」を参照してください。

名前付きクエリ

リファレンストピック:「AWS CloudFormation ユーザーガイド」の「AWS::Athena::NamedQuery

AWS CloudFormation を使用して名前付きクエリを指定し、それらを Athena で実行します。名前付きクエリは、クエリ名をクエリにマップしてから、そのクエリを保存されたクエリとして Athena コンソールから実行することを可能にします。詳細については、「Amazon Athena ユーザーガイド」の「保存されたクエリを使用する」、および「Amazon Athena API リファレンス」の「CreateNamedQuery」を参照してください。

プリペアドステートメント

参考トピック:「AWS CloudFormation ユーザーガイド」の「AWS::Athena::PreparedStatement

Athena での SQL クエリで使用する準備済みステートメントを指定します。準備済みステートメントにはパラメータプレースホルダが含まれており、それらの値は実行時に提供されます。詳細については、「Amazon Athena ユーザーガイド」の「パラメータ化されたクエリを使用する」、および「Amazon Athena API リファレンス」の「CreatePreparedStatement」を参照してください。

Workgroup

参照トピック:「AWS CloudFormation ユーザーガイド」の「AWS::Athena::WorkGroup

AWS CloudFormation を使用して Athena ワークグループを指定します。Athena ワークグループは、ユーザーまたはユーザーのグループのクエリを同じアカウント内の他のクエリから分離するために使用します。詳細については、「Amazon Athena ユーザーガイド」の「ワークグループを使用してクエリのアクセスとコストを制御する」、および「Amazon Athena API リファレンス」の「CreateWorkGroup」を参照してください。

Amazon CloudFront

参照トピック: Amazon CloudFront ログのクエリ

Athena を使用して Amazon CloudFront ログをクエリします。CloudFront の使用に関する詳細については、「Amazon CloudFront デベロッパーガイド」を参照してください。

AWS CloudTrail

参照トピック: AWS CloudTrail ログをクエリする

CloudTrail ログでの Athena の使用は、AWS のサービスのアクティビティ分析を強化するための優れた手段です。たとえば、クエリを使用して傾向を識別したり、ソース IP アドレスやユーザーなど属性でアクティビティをさらに分離したりすることが可能です。CloudTrail コンソールからログを直接クエリするためのテーブルを作成して、これらのテーブルを Athena でのクエリの実行に使用できます。詳細については、「CloudTrail ログ用の Athena テーブルを作成するために CloudTrail コンソールを使用する 」を参照してください。

Amazon DataZone

参照トピック: Athena で Amazon DataZone を使用する

Amazon DataZone」を使用して組織の境界を越えてデータを大規模に共有、検索、検出します。DataZone は、Athena、AWS Glue、AWS Lake Formation などの AWS 分析サービス全体のエクスペリエンスを簡素化します。さまざまなデータソースに大量のデータがある場合、Amazon DataZone を使用して、人、データ、ツールをビジネスユースケースに基づいてグループ化できます。

Athena では、クエリエディターを使用して DataZone 環境にアクセスしてクエリを実行できます。詳細については、「Athena で Amazon DataZone を使用する」を参照してください。

Elastic Load Balancing

参照トピック: Application Load Balancer ログをクエリする

Application Load Balancer のログをクエリすることで、トラフィックの送信元、レイテンシー、Elastic Load Balancing インスタンスとバックエンドアプリケーションとの間で転送されるバイト数を確認できます。詳細については、「Application Load Balancer ログをクエリする」を参照してください。

参照トピック: Classic Load Balancer ログをクエリする

Classic Load Balancer ログをクエリして、Elastic Load Balancing インスタンスとバックエンドアプリケーションで送受信されるトラフィックのパターンを分析し、理解します。トラフィックの送信元、レイテンシー、および転送されたバイト数を確認できます。詳細については、「Classic Load Balancer ログをクエリする」を参照してください。

Amazon EMR Studio

参照トピック: Use the Amazon Athena SQL editor in EMR Studio

EMR Studio で Athena を使用し、インタラクティブなクエリを開発して実行できます。これにより、Spark、Scala、その他のワークロードに使用するときと同じ Amazon EMR インターフェイスから、Athena 上の SQL 分析に EMR Studio を使用できるようになります。EMR Studio に Athena を統合すると、次のタスクを実行できます。

  • Athena SQL クエリの実行

  • クエリ結果を表示する

  • クエリ履歴の表示

  • 保存されたクエリの表示

  • パラメータ化されたクエリの実行

  • データカタログのデータベース、テーブル、ビューの表示

次の Athena 機能は Amazon EMR Studio では利用できません。

  • Athena ワークグループ、データソース、キャパシティ予約の作成または更新などの管理者機能

  • Athena for Spark または Spark ノートブック

  • DataZone 統合

  • Step Functions

EMR Studio と Athena の統合は、EMR Studio および Athena が利用可能なすべての AWS リージョン で利用可能です。EMR Studio での Athena の使用についての詳細は、「Amazon EMR 管理ガイド」の「Use the Amazon Athena SQL editor in EMR Studio」を参照してください。

AWS Glue Data Catalog

参照トピック: AWS Glue を使用して Athena を Amazon S3 のデータに接続する

Athena は、Amazon S3 内のデータに永続的なメタデータストアを提供する AWS Glue Data Catalog と統合します。これにより、Amazon Web Services アカウント全体で利用でき、AWS Glue の ETL およびデータ検出機能と統合された中央メタデータストアに基づいて、Athena でのテーブルの作成とデータのクエリを行うことが可能になります。詳細については、「AWS Glue を使用して Athena を Amazon S3 のデータに接続する」と、「AWS Glue デベロッパーガイド」の「AWS Glue とは」を参照してください。

AWS Identity and Access Management (IAM)

リファレンストピック: Amazon Athena 向けのアクション

IAM アクセス許可ポリシーで Athena API アクションを使用できます。詳細については、「Amazon Athena 向けのアクション」と「Athena でのアイデンティティとアクセス権の管理」を参照してください。

Amazon QuickSight

参照トピック: ODBC および JDBC ドライバーを使用して Amazon Athena に接続する

Athena は Amazon QuickSight と統合して、データを簡単に可視化できるようにします。Athena を使用して、JDBC や ODBC ドライバーで接続されたビジネスインテリジェンスツールや SQL クライアントでレポートを生成、またはデータを探索できます。Amazon QuickSight の詳細については、「Amazon QuickSight ユーザーガイド」の「Amazon QuickSight とは」を参照してください。Athena での JDBC および ODBC ドライバーの使用に関する詳細については、「ODBC および JDBC ドライバーを使用した Amazon Athena への接続」を参照してください。

Amazon S3 インベントリ

リファレンストピック:「Amazon Simple Storage Service ユーザーガイド」の「Amazon Athena でインベントリをクエリする

Amazon Athena を使用して、標準 SQL を使用した Amazon S3 インベントリのクエリを実行できます。Amazon S3 インベントリは、ビジネス、コンプライアンス、および規制上のニーズに関するオブジェクトのレプリケーションと暗号化のステータスを監査し、報告するために使用できます。詳細については、「Amazon Simple Storage Service ユーザーガイド」の「Amazon S3 インベントリ」を参照してください。

AWS Step Functions

リファレンストピック: AWS Step Functions デベロッパーガイドの「Step Functions で Athena を呼び出す

Athena を呼び出すため AWS Step Functions を使用します。AWS Step Functions では、Amazon States Language を使用することで、AWS のサービス の選択を直接制御できます。Step Functions を Athena で使用して、クエリの実行の開始と停止、クエリ結果の取得、アドホックまたはスケジュールされたデータクエリの実行、Simple Storage Service (Amazon S3) 内のデータレイクからの結果の取得を行うことができます。Step Functions ロールには Athena を使用する権限が必要です。詳細については、「AWS Step Functions デベロッパーガイド」を参照してください。

動画: AWS Step Functions を使用した Amazon Athena クエリのオーケストレーション

以下の動画では、Amazon Athena と AWS Step Functions を使用して定期的にスケジュールされた Athena クエリを実行し、対応するレポートを生成する方法が紹介されています。

Step Functions と Amazon EventBridge を使用して AWS Glue DataBrew、Athena、および Amazon QuickSight のオーケストレーションを実行する例については、「AWS ビッグデータブログ」の「AWS Step Functions を使用した AWS Glue DataBrew ジョブと Amazon Athena クエリ のオーケストレーション」を参照してください。

AWS Systems Manager インベントリ

リファレンストピック:「AWS Systems Manager ユーザーガイド」の「複数のリージョンとアカウントからのインベントリデータをクエリする

AWS Systems Manager インベントリは Amazon Athena と統合されており、複数の AWS リージョン およびアカウントからインベントリデータをクエリできます。詳細については、「AWS Systems Managerユーザーガイド」を参照してください。

Amazon Virtual Private Cloud

参照トピック: Amazon VPC フローログのクエリ

Amazon Virtual Private Cloud フローログは、VPC 内のネットワークインターフェイス間で送受信される IP トラフィックに関する情報を取得します。Athena のログをクエリしてネットワークトラフィックパターンを調査し、Amazon VPC ネットワーク全体の脅威とリスクを特定します。Amazon VPC の詳細については、「Amazon VPC ユーザーガイド」を参照してください。