リリースノート - Amazon Athena

リリースノート

Amazon Athena の特徴、改良点、およびバグ修正についてリリース日順に説明します。

Athena リリースノート (2024 年)

2024 年 10 月 30 日

公開日: 2024 年 10 月 30 日

Athena が JDBC ドライバーバージョン 3.3.0 をリリースしました。このバージョンのドライバーの詳細については、「Amazon Athena ODBC 3.x リリースノート」を参照してください。JDBC 3.x ドライバーをダウンロードするには、「JDBC 3.x ドライバーのダウンロード」を参照してください。

2024 年 8 月 23 日

公開日: 2024 年 9 月 5 日

Athena は、次の発表をしました。

  • パススルークエリによるフェデレーションビューのクエリ — フェデレーションパススルークエリがビューでサポートされるようになりました。詳細については、「フェデレーテッドビューをクエリする」を参照してください。

  • 複数のパススルークエリ – 同じクエリ実行で複数のフェデレーションパススルークエリを実行できるようになりました。詳細については、「フェデレーテッドパススルークエリを使用する」を参照してください。

  • Iceberg テーブルの OPTIMIZE 修正 — 関連付けられた削除ファイルを持つデータファイルを書き換えるときに、Iceberg テーブルで OPTIMIZE を実行しても「削除」ファイルが削除されない問題を修正しました。詳細については、「OPTIMIZE」を参照してください。

  • Parquet LZ4 および LZO 書き込みサポート – Athena は、LZ4 または LZO 形式で圧縮された Parquet ファイルの書き込みをサポートしなくなりました。これらの圧縮形式の読み取りは引き続きサポートされています。Athena での圧縮形式については、「Athena で圧縮を使用する」を参照してください。

2024 年 7 月 29 日

公開日: 2024 年 7 月 29 日

Athena が JDBC ドライバーバージョン 3.2.2 をリリースしました。このバージョンのドライバーの詳細については、「Amazon Athena ODBC 3.x リリースノート」を参照してください。JDBC 3.x ドライバーをダウンロードするには、「JDBC 3.x ドライバーのダウンロード」を参照してください。

2024 年 7 月 26 日

公開日: 2024 年 8 月 1 日

Athena は、次の改善を発表しました。

2024 年 7 月 3 日

公開日: 2024 年 7 月 3 日

Athena が JDBC ドライバーバージョン 3.2.1 をリリースしました。このバージョンのドライバーの詳細については、「Amazon Athena ODBC 3.x リリースノート」を参照してください。JDBC 3.x ドライバーをダウンロードするには、「JDBC 3.x ドライバーのダウンロード」を参照してください。

2024 年 6 月 26 日

公開日: 2024 年 6 月 26 日

南米 (サンパウロ) および欧州 (スペイン) リージョンでプロビジョニングされた容量が一般に利用可能になりました。プロビジョニングされた容量を使用することで、フルマネージドコンピューティング性能で SQL クエリを実行し、最も重要なインタラクティブなワークロードの優先順位付け、制御、スケーリングを行うワークロード管理機能を提供できます。いつでも容量を追加して、同時に実行するクエリの数を増やしたり、そのキャパシティを使用するワークロードを制御したり、ワークロード間でキャパシティを共有したりできます。

詳細については、「クエリ処理キャパシティを管理する」を参照してください。料金の詳細については、「Amazon Athena 料金表」ページを参照してください。

2024 年 5 月 10 日

公開日: 2024 年 7 月 15 日

Athena は、次の機能と改善点を発表しました。

  • Delta Lake – Athena は、チェックポイントファイルから不要なエントリを除外する最適化を追加しました。これらの最適化により、多くの Parquet データファイルを参照する大きなチェックポイントファイルを持つクエリのパフォーマンスが大幅に改善します。

Athena で Linux Foundation Delta Lake テーブルの使用については、「Linux Foundation Delta Lake テーブルをクエリする」を参照してください。

2024 年 4 月 26 日

公開日: 2024 年 4 月 26 日

Athena が JDBC ドライバーバージョン 3.2.0 をリリースしました。このバージョンのドライバーの詳細については、「Amazon Athena ODBC 3.x リリースノート」を参照してください。JDBC 3.x ドライバーをダウンロードするには、「JDBC 3.x ドライバーのダウンロード」を参照してください。

2024 年 4 月 24 日

公開日: 2024 年 4 月 24 日

Athena は、次の修正と改善を発表しました。

  • Parquet – Athena は、リストやマップグループに含まれていない、注釈のない繰り返しプリミティブフィールドに対して、Parquet での下位互換性のある読み取りをサポートするようになりました。この変更により、正しくない結果がそのまま返されることがなくなり、スキーマの不一致に対するエラーメッセージが改善されました。

    詳細については、GitHub.com の Parquet の「Support backwards compatible reads for unannotated repeated primitive fields in Parquet」(注釈のない繰り返しプリミティブフィールドに対する下位互換性のある読み取りのサポート) を参照してください。

  • Iceberg OPTIMIZE – 非パーティションキーフィルターが WHERE 句で使用されたときにデータが失われる原因となる OPTIMIZE クエリの問題を解決しました。詳細については、「OPTIMIZE」を参照してください。

2024 年 4 月 16 日

公開日: 2024 年 4 月 16 日

新しい Amazon Athena フェデレーテッドクエリパススルー機能を使用して、クエリの全体を基盤となるデータソースで直接実行します。フェデレーテッドパススルークエリは、元のデータソース固有の関数、クエリ言語、パフォーマンス機能を活用できるようにします。たとえば、PartiQL 言語を使用して、DynamoDB で Athena クエリを実行することができます。フェデレーテッドパススルークエリは、Athena では使用できないデータソースの関数を集約、結合、または呼び出す SELECT クエリを実行する場合にも役立ちます。パススルークエリを使用することで Athena が処理するデータの量が低減するため、クエリ時間の短縮につながります。

詳細については、「フェデレーテッドパススルークエリを使用する」を参照してください。現在使用しているコネクタを最新バージョンにアップグレードするには、「データソースコネクタを更新する」を参照してください。

2024 年 4 月 10 日

公開日: 2024 年 4 月 10 日

Athena は、次の機能と改善点を発表しました。

ODBC 1.2.3.1000 ドライバー

Athena 用の ODBC 1.2.3.1000 ドライバーがリリースされました。

解決された問題:

  • プロキシサーバーの接続問題 – ルート証明書なしでプロキシサーバーを使用すると、コネクタが接続の確立に失敗していました。

ODBC 1.x ドライバー、リリースノート、ドキュメントのダウンロード、および詳細については、「Athena ODBC 1.x ドライバー」を参照してください。

JDBC 2.1.5 ドライバー

Athena 用の JBDC 2.1.5 ドライバーがリリースされました。

更新と機能拡張:

  • バージョン 1.12.687 を使用するように AWS Java SDK を更新しました。

  • バージョン 2.16.0 を使用するように Jackson ライブラリを更新しました。

  • バージョン 1.3.14 を使用するように Logback ライブラリを更新しました。

JDBC 2.x ドライバー、リリースノート、ドキュメントのダウンロード、および詳細については、「Athena JDBC 2.x ドライバー」を参照してください。

2024 年 4 月 8 日

公開日: 2024 年 4 月 8 日

Athena が ODBC ドライバーバージョン 2.0.3.0. を発表しました。詳細については、2.0.3.0 のリリースノートを参照してください。新しい ODBC v2 ドライバーをダウンロードするには、「ODBC 2.x ドライバーのダウンロード」を参照してください。接続情報については、「Amazon Athena ODBC 2.x」を参照してください。

2024 年 3 月 15 日

公開日: 2024 年 3 月 18 日

Amazon Athena が、カナダ西部 (カルガリー) リージョンでの Athena SQL の提供開始を発表しました。

各 AWS リージョン で利用できる AWS のサービス の一覧については、「地域別の AWS サービス」を参照してください。

2024 年 2 月 15 日

公開日: 2024 年 2 月 15 日

Athena が JDBC ドライバーバージョン 3.1.0 をリリースしました。

Amazon Athena JDBC ドライバーバージョン 3.1.0 は、Microsoft Active Directory Federation Services (AD FS) Windows 統合認証と、フォームベース認証のサポートを追加します。3.1.0 リリースには、その他の軽微な改善とバグ修正も含まれています。

JDBC v3 ドライバーをダウンロードするには、「JDBC 3.x ドライバーのダウンロード」を参照してください。

2024 年 1 月 31 日

公開日: 2024 年 1 月 31 日

Athena は、次の機能と改善点を発表しました。

  • Hudi アップグレード – Athena SQL を使用して Hudi 0.14.0 テーブルをクエリできるようになりました。HUDI テーブルをクエリするための Athena SQL の使用については、「Apache Hudi データセットをクエリする」を参照してください。

Athena リリースノート (2023 年)

2023 年 12 月 14 日

公開日: 2023 年 12 月 14 日

Athena は、次の修正と改善を発表しました。

Athena は、JDBC ドライバーのバージョン 2.1.3 をリリースしました。ドライバーは次の問題を解決します。

  • Spring Boot や Gradle アプリケーションのロギングとの競合を避けるため、ロギングが改善されました。

  • executeBatch() JDBC メソッドを使用してレコードを挿入する際、ドライバーが誤って 1 つのレコードのみを挿入しました。Athena はクエリのバッチ実行をサポートしていないため、executeBatch() 使用時にドライバーがエラーを報告するようになりました。この制限を回避するには、1 つのクエリをループで送信できます。

新しい JDBC ドライバー、リリースノート、およびドキュメントをダウンロードするには、「Athena JDBC 2.x ドライバー」を参照してください。

2023 年 12 月 9 日

公開日: 2023 年 12 月 9 日

Athena 用の ODBC 1.2.1.1000 ドライバーがリリースされました。

特徴と拡張機能:

  • RStudio サポートの更新 — ODBC ドライバーが macOS 上の RStudio をサポートするようになりました。

  • 単一のカタログとスキーマのサポート — コネクタが 1 つのカタログとスキーマを返すことができるようになりました。詳細については、ダウンロード可能なインストールおよび設定ガイドを参照してください。

解決された問題:

  • 準備済みステートメント — 列単位のスキーマを使用するパラメータ配列を含む準備済みステートメントを実行すると、コネクタが誤ったクエリ結果を返しました。

  • 列サイズ$file_modified_time システム列を選択すると、コネクタが誤った列サイズを返しました。

  • SQLPrepareSELECT クエリに対して SQLPrepare に関連するパラメータをバインドすると、コネクタがエラーを返しました。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「Athena ODBC 1.x ドライバー」を参照してください。

2023 年 12 月 7 日

公開日: 2023 年 12 月 7 日

Athena は ODBC ドライバーバージョン 2.0.2.1 を発表しました。詳細については、2.0.2.1 のリリースノートを参照してください。新しい ODBC v2 ドライバーをダウンロードするには、「ODBC 2.x ドライバーのダウンロード」を参照してください。接続情報については、「Amazon Athena ODBC 2.x」を参照してください。

2023 年 12 月 5 日

公開日: 2023 年 12 月 5 日

AWS IAM Identity Center 認証モードを使用する Athena SQL ワークグループを作成できるようになりました。これらのワークグループは IAM アイデンティティセンターの信頼できる ID 伝達機能をサポートしています。信頼できる ID 伝達により、Amazon Athena や Amazon EMR Studio などの AWS 分析サービスでアイデンティティを使用できるようになります。

詳細については、「IAM アイデンティティセンターが有効な Athena ワークグループを使用する」を参照してください。

2023 年 11 月 28 日

公開日: 2023 年 11 月 28 日

Amazon S3 Express One Zone ストレージクラス内のデータをクエリして、高速にクエリ結果を得られるようになりました。S3 Express One Zone は、最も頻繁にアクセスされるデータやレイテンシーの影響を受けやすいアプリケーションに、1 桁のミリ秒単位で一貫したデータアクセスを提供することを目的とした、高性能で単一アベイラビリティーゾーンのストレージクラスです。まず、データを S3 Express One Zone ストレージに移動し、Athena でシームレスなクエリを実行できるようにデータを AWS Glue Data Catalog とカタログ化します。

詳細については、「S3 Express One Zone データをクエリする」を参照してください。

2023 年 11 月 27 日

公開日: 2023 年 11 月 27 日

Athena は、次の機能と改善点を発表しました。

  • Glue データカタログビュー — Glue データカタログビューは、Amazon Athena や Amazon Redshift などの AWS サービスに共通する 1 つのビューを提供します。Glue データカタログビューでは、アクセス許可はビューをクエリするユーザーではなく、ビューを作成したユーザーによって定義されます。これらのビューを使用することで、アクセスコントロールの強化、完全なレコードの確保、セキュリティの強化、基礎となるテーブルへのアクセスの防止を実現することができます。

    詳細については、「Athena でデータカタログビューを使用する」を参照してください。

  • CloudTrail Lake のサポート — Amazon Athena を使用して AWS CloudTrail LakeAWS CloudTrail のデータを分析できるようになりました。Lake は CloudTrail 用のマネージドデータレイクであり、監査、セキュリティ、運用調査のためのアクティビティログの集約、不変的な保存、分析に使用できます。Athena から CloudTrail Lake アクティビティログをクエリするために、データを移動したり、個別のデータ処理パイプラインを構築したりする必要はありません。ETL オペレーションは必要ありません。

    開始するには、CloudTrail Lake でデータフェデレーションを有効にします。CloudTrail Lake イベントデータストアのメタデータを AWS Glue Data Catalog と共有すると、CloudTrail は必要な AWS Glue Data Catalog リソースを作成し、データを AWS Lake Formation に登録します。Lake Formation では、Athena を使用してイベントデータストアをクエリできるユーザーとロールを指定できます。

    詳細については、「AWS CloudTrail ユーザーガイド」の「Enable Lake query federation」を参照してください。

2023 年 11 月 17 日

公開日: 2023 年 11 月 17 日

Athena は、次の機能と改善点を発表しました。

機能

  • コストベースオプティマイザー — Athena は、AWS Glue の統計を使用したコストベースの最適化の一般提供を発表しました。Athena SQL のクエリを最適化するには、Athena がテーブルを収集するようにリクエストするか、AWS Glue のテーブルの列レベル統計を収集するようにリクエストできます。クエリのすべてのテーブルに統計がある場合、Athena はその統計を使用して代替の実行プランを調べたうえ、最も速いと思われる実行プランを選択します。

    詳細については、「コストベースオプティマイザーを使用する」を参照してください。

  • Amazon EMR Studio の統合 — Athena コンソールを直接使用することなく、Amazon EMR Studio で Athena を使用できるようになりました。Amazon EMR で Athena 統合を使用すると、次のタスクを実行できます。

    • Athena SQL クエリの実行

    • クエリ結果を表示する

    • クエリ履歴の表示

    • 保存されたクエリの表示

    • パラメータ化されたクエリの実行

    • データカタログのデータベース、テーブル、ビューの表示

    詳細については、AWS のサービス における Athena との統合 トピックの「Amazon EMR Studio」を参照してください。

  • ネストされたアクセス制御 — Athena が、ネストされたデータの Lake Formation アクセス制御のサポートを発表しました。Lake Formation では、struct データ型を持つネストされた列にデータフィルターを定義して適用できます。データフィルタリングを使用し、ネストされた列のサブ構造へのユーザーアクセスを制限できます。ネストされたデータにデータフィルターを作成する方法の詳細については、「AWS Lake Formation デベロッパーガイド」の「データフィルターの作成」を参照してください。

  • プロビジョニングされたキャパシティーの使用状況メトリクス — Athena は、キャパシティ予約の新しい CloudWatch メトリクスを発表しました。新しいメトリクスを使用して、プロビジョニングした DPU の数とクエリによって使用されている DPU 数を管理できます。クエリが終了すると、クエリが消費した DPU 数も表示できます。

    詳細については、「CloudWatch による Athena クエリメトリクスのモニタリング」を参照してください。

改良点

  • エラーメッセージの変更Insufficient Lake Formation permissions エラーメッセージは Table not found または Schema not found として表示されるようになりました。この変更は、悪意のある攻撃者がエラーメッセージからテーブルまたはデータベースリソースの存在を推測するのを防ぐために行われました。

2023 年 11 月 16 日

公開日: 2023 年 11 月 16 日

Athena は、互換性のある SQL 開発およびビジネスインテリジェンスアプリケーションからデータへの接続、クエリ、視覚化のエクスペリエンスを向上させる新しい JDBC ドライバーをリリースしました。新しいドライバーは簡単にアップグレードできます。ドライバーは Amazon S3 から直接クエリ結果を読み取り、クエリ結果をより早く利用可能にします。

詳細については、「Athena JDBC 3.x ドライバー」を参照してください。

2023 年 10 月 31 日

公開日: 2023 年 10 月 31 日

Amazon Athena は、プロビジョニングされたキャパシティの 1 時間の予約を発表しました。本日より、1 時間後にプロビジョニングされたキャパシティを予約して解放できます。この変更により、時間ととも需要が変化するワークロードのコスト最適化が容易になります。

プロビジョニングされたキャパシティは Atena の機能であり、最も重要なインタラクティブワークロードの優先、制御、スケーリングを行えるようにするワークロード管理機能 いつでも容量を追加して、同時に実行するクエリの数を増やしたり、そのキャパシティを使用するワークロードを制御したり、ワークロード間でキャパシティを共有したりできます。

詳細については、「クエリ処理キャパシティを管理する」を参照してください。料金の詳細については、「Amazon Athena 料金表」ページを参照してください。

2023 年 10 月 25 日

公開日: 2023 年 10 月 26 日

Athena は、次の修正と改善を発表しました。

jackson-core パッケージ — 1,000 文字を超える数値の JSON テキストは失敗するようになりました。この修正は「sonatype-2022-6438」のセキュリティ問題を解決します。

2023 年 10 月 17 日

公開日: 2023 年 10 月 17 日

Athena は ODBC ドライバーバージョン 2.0.2.0 を発表しました。詳細については、2.0.2.0 のリリースノートを参照してください。新しい ODBC v2 ドライバーをダウンロードするには、「ODBC 2.x ドライバーのダウンロード」を参照してください。接続情報については、「Amazon Athena ODBC 2.x」を参照してください。

2023 年 9 月 26 日

公開日: 2023 年 9 月 26 日

Athena は、次の機能と改善点を発表しました。

2023 年 8 月 23 日

公開日: 2023 年 8 月 23 日

Amazon Athena は、イスラエル (テルアビブ) リージョンで Athena SQL が利用可能になったことを発表しました。

各 AWS リージョン で利用できる AWS のサービス の一覧については、「地域別の AWS サービス」を参照してください。

2023 年 8 月 10 日

公開日: 2023 年 8 月 10 日

Athena は、次の修正と改善を発表しました。

ODBC ドライバーバージョン 2.0.1.1

Athena は ODBC ドライバーバージョン 2.0.1.1 を発表しました。詳細については、2.0.1.1 のリリースノートを参照してください。新しい ODBC v2 ドライバーをダウンロードするには、「ODBC 2.x ドライバーのダウンロード」を参照してください。接続情報については、「Amazon Athena ODBC 2.x」を参照してください。

JDBC ドライバーバージョン 2.1.1

Athena は、JDBC ドライバーのバージョン 2.1.1 をリリースしました。ドライバーは次の問題を解決します。

  • 正規表現を含むステートメントを使用してテーブルが作成されたときに発生していたエラー。

  • ApplicationName 接続パラメータが正しく適用されない原因となっていた問題。

新しい JDBC ドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。

2023 年 7 月 31 日

公開日: 2023 年 7 月 31 日

Amazon Athena は、追加の AWS リージョンで Athena SQL が利用可能になったことを発表しました。

このリリースでは、Athena SQL の提供地域を、アジアパシフィック (ハイデラバード)、アジアパシフィック (メルボルン)、欧州 (スペイン)、欧州 (チューリッヒ) に拡大します。

各 AWS リージョン で利用できる AWS のサービス の一覧については、「地域別の AWS サービス」を参照してください。

2023 年 7 月 27 日

公開日: 2023 年 7 月 27 日

Athena では、Google BigQuery コネクタバージョン 2023.30.1 がリリースされました。このバージョンのコネクタでは、クエリの実行時間が短縮され、BigQuery プライベートエンドポイントに対するクエリのサポートが追加されました。

Google BigQuery コネクタの詳細については、「Amazon Athena Google BigQuery コネクタ」を参照してください。既存のデータソースコネクタの更新については、「データソースコネクタを更新する」を参照してください。

2023 年 7 月 24 日

公開日: 2023 年 7 月 24 日

Athena は、次の修正と改善を発表しました。

  • UNION クエリ — 特定のUNION クエリのパフォーマンスが向上しました。

  • 型比較による結合 — 2 つの異なる型の比較を含む JOIN ステートメントの潜在的なクエリの失敗を修正しました。

  • ネストされた列のサブクエリ — サブクエリがネストされた列に相関しているときにクエリが失敗する問題を修正しました。

  • アイスバーグビュー — Apache Iceberg ビューのタイムスタンプ列の精度に関する互換性の問題を修正しました。タイムスタンプ列を持つ Iceberg ビューが、その列が Athena エンジンバージョン 2 で作成されたか、または Athena エンジンバージョン 3 で作成されたかに関係なく読み取りが可能になりました。

2023 年 7 月 20 日

公開日: 2023 年 7 月 20 日

Athena は、JDBC ドライバーのバージョン 2.1.0 をリリースします。ドライバーに新しい機能拡張が追加されて、問題が解決されました。

機能強化

以下の Jackson JSON パーサーライブラリがアップグレードしました。

  • jackson-annotations 2.15.2 (以前は 2.14.0)

  • jackson-core 2.15.2 (以前は 2.14.0)

  • jackson-databind 2.15.2 (以前は 2.14.0)

解決された問題

  • sql2o ライブラリ使用時に配列パラメータを渡す際の問題を修正しました。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。

2023 年 7 月 13 日

公開日: 2023 年 9 月 19 日

Athena は、次の機能と改善点を発表しました。

  • EXPLAIN ANALYZEEXPLAIN ANALYZE の出力にキュー、分析、計画、実行時間のサポートを追加しました。

  • EXPLAINEXPLAIN — クエリに集約が含まれている場合、出力に統計が表示されるようになりました。

  • Parquet Hive SerDe — Parquet データを読み取る際に処理統計を無視できるようにする parquet.ignore.statistics プロパティを追加しました。詳細については、Parquet 統計を無視する を参照してください。

EXPLAINEXPLAIN ANALYZE の詳細については、「Athena での EXPLAIN および EXPLAIN ANALYZE の使用」を参照してください。Parquet Hive については、「Parquet SerDe」を参照してください。

2023 年 7 月 3 日

公開日: 2023 年 7 月 25 日

Athena では、2023 年 7 月 3 日から CloudTrail ログのクエリ文字列を編集できるようになりました。クエリ文字列の値は ***OMITTED*** になりました。機密情報を含む可能性のあるテーブル名やフィルター値の意図しない漏洩を防止するために、この変更を行いました。これまで CloudTrail ログを使用してクエリ文字列全体にアクセスしていた場合は、Athena::GetQueryExecution API を使用し、CloudTrail ログから responseElements.queryExecutionId の値を渡すことをお勧めします。詳細については、「Amazon Athena API リファレンス」の「GetQueryExecution」ページのアクションを参照してください。

2023 年 6 月 30 日

公開日: 2023 年 6 月 30 日

Athena クエリエディタで、クエリの作成を高速化するための先行入力コード候補がサポートされるようになりました。次の機能を使用して、SQL クエリをより正確に、より効率的に記述できるようになりました。

  • 入力すると、キーワード、ローカル変数、スニペット、およびカタログ項目の候補がリアルタイムで表示されます。

  • データベース名またはテーブル名の後にドットを入力すると、エディタはテーブルまたは列のリストを表示して選択できるため便利です。

  • スニペットの候補にカーソルを合わせると、概要にスニペットの構文と使用法の概要が表示されます。

  • コードの読みやすさを向上させるため、キーワードとその強調表示ルールも Trino と Hive の最新構文に合わせて更新されました。

この機能は、デフォルトでご利用になれます。コードエディタの環境設定でこの機能を有効/無効にできます。

Athena クエリエディタで先行入力コード候補を試すには、Athena コンソール https://console.aws.amazon.com/athena/ にアクセスしてください。

2023 年 6 月 29 日

公開日: 2023 年 6 月 29 日

  • Athena は ODBC ドライバーバージョン 2.0.1.0 を発表しました。詳細については、2.0.1.0 のリリースノートを参照してください。新しい ODBC v2 ドライバーをダウンロードするには、「ODBC 2.x ドライバーのダウンロード」を参照してください。接続情報については、「Amazon Athena ODBC 2.x」を参照してください。

  • Athena とその機能 が中東 (UAE) 地域で利用できるようになりました。各 AWS リージョン で利用できる AWS のサービス の一覧については、「地域別の AWS サービス」を参照してください。

2023 年 6 月 28 日

公開日: 2023 年 6 月 28 日

Amazon Athena を使用して、S3 Glacier Flexible Retrieval (以前の Glacier) と S3 Glacier Deep Archive Amazon S3 ストレージクラスから復元されたオブジェクトをクエリできるようになりました。テーブルごとにこの機能を設定します。この機能は、Athena エンジンバージョン 3 の Apache Hive テーブルでのみサポートされています。

詳細については、「復元された Amazon S3 Glacier オブジェクトをクエリする」を参照してください。

2023 年 6 月 12 日

公開日: 2023 年 6 月 12 日

Athena は、次の修正と改善を発表しました。

  • Parquet Reader のタイムスタンプ — Parquet Reader のタイムスタンプを bigint (ミリ秒) として読み取るサポートが追加されました。この更新により、Athena エンジンバージョン 2 のサポートと同等に提供されます。

  • EXPLAIN ANALYZE — EXPLAIN ANALYZE のクエリ統計と出力に物理入力の読み取り時間を追加しました。EXPLAIN ANALYZE の詳細については、「Athena での EXPLAIN および EXPLAIN ANALYZE の使用」を参照してください。

  • INSERTINSERT で書き込まれたテーブルのクエリパフォーマンスが向上しました。INSERT の詳細については、「INSERT INTO」を参照してください。

  • Delta Lake テーブル — Delta Lake テーブルの DROP TABLE が同時に変更された場合に完全に削除できないという問題が修正されました。

2023 年 6 月 8 日

公開日: 2023 年 6 月 8 日

Amazon Athena for Apache Spark が、以下の新機能を発表しました。

Amazon Athena for Apache Spark の詳細については、「Amazon Athena で Apache Spark を使用する」を参照してください。

2023 年 6 月 2 日

公開日: 2023 年 6 月 2 日

Athena でキャパシティ予約を削除し、AWS CloudFormation テンプレートを使用して Athena キャパシティ予約を指定できるようになりました。

  • キャパシティ予約の削除 – Athena でキャンセルされたキャパシティ予約を削除できるようになりました。予約は削除する前にキャンセルする必要があります。キャパシティ予約を削除すると、予約はアカウントからすぐに削除されます。削除された予約は参照できなくなります (ARN を使用する場合を含む)。予約を削除するために、Athena コンソールまたは Athena API を使用できます。詳細については、「Amazon Athena ユーザーガイド」の「キャパシティ予約を削除する」、および「Amazon Athena API リファレンス」の「DeleteCapacityReservationページのアクションを参照してください。」を参照してください。

  • キャパシティ予約に AWS CloudFormation テンプレートを使用 – AWS CloudFormation テンプレートと AWS::Athena::CapacityReservation リソースを使用して Athena キャパシティ予約を指定できるようになりました。詳細については、「AWS CloudFormation ユーザーガイド」の「AWS::Athena::CapacityReservation」を参照してください。

キャパシティ予約を使用して Athena でキャパシティをプロビジョニングする方法の詳細については、「クエリ処理キャパシティを管理する」を参照してください。

2023 年 5 月 25 日

公開日: 2023 年 5 月 25 日

Athena は、データソースコネクタのアップデートをリリースしました。このアップデートにより、フェデレーテッドクエリのパフォーマンスが改善されます。新しいプッシュダウンの最適化と動的フィルタリングにより、Athena ではなくソースデータベースでより多くのオペレーションを実行できるようになります。これらの最適化により、クエリのランタイムとスキャンされるデータ量が削減されます。これらの改善の恩恵を受けるには、Athena エンジンバージョン 3 が必要です。

次のコネクタが更新されました。

データソースコネクタのアップグレードについては、「データソースコネクタを更新する」を参照してください。

2023 年 5 月 18 日

公開日: 2023 年 5 月 18 日

Amazon Athena への IPv6 インバウンド接続に AWS PrivateLink を使用できるようになりました。

Amazon Athena は、AWS PrivateLink を含めるために、インターネットプロトコルバージョン 6 (IPv6) エンドポイントを通じたインバウンド接続のサポートを拡張しました。本日より、以前から利用可能であったパブリック IPv6 エンドポイントに加えて、AWS PrivateLink を使用して Amazon Virtual Private Cloud (Amazon VPC) からも安全かつプライベートに Athena に接続できるようになりました。

インターネットの急速な成長により、利用可能なインターネットプロトコルバージョン 4 (IPv4) アドレスが枯渇しつつあります。IPv6 では、使用可能なアドレスの数が数倍に増加するため、VPC 内で重複するアドレス空間を管理する必要がなくなりました。このリリースでは、IPv6 アドレス指定の利点と、AWS PrivateLink のセキュリティおよびパフォーマンスの利点を組み合わせることができるようになりました。

プログラムにより AWS サービスに接続するには、AWS CLI または AWS SDK を使用してエンドポイントを指定できます。サービスエンドポイントと Athena サービスエンドポイントの詳細については、「Amazon Web Services 全般のリファレンス」の「AWSサービスエンドポイント」と「Amazon Athena エンドポイントとクォータ」を参照してください。

2023 年 5 月 15 日

公開日: 2023 年 5 月 15 日

Athena は、DynamoDB、CloudWatch Logs、CloudWatch Metrics、AWS CMDB 用の Apache Spark DataSourceV2 (DSV2) コネクタのリリースを発表しました。新しい DSV2 コネクタで Spark を使用してこれらのデータソースをクエリできます。DSV2 コネクタは、対応する Athena フェデレーテッドコネクタと同じパラメータを使用します。DSV2 コネクタは Spark ワーカー上で直接実行されるため、使用するために Lambda 関数をデプロイする必要はありません。

詳細については、「Apache Spark のデータソースコネクタを操作する」を参照してください。

2023 年 5 月 10 日

公開日: 2023 年 5 月 10 日

Athena 用の ODBC 1.1.20 ドライバーがリリースされました。

特徴と拡張機能:

  • Lake Formation エンドポイントのオーバーライドのサポート。

  • ADFS 認証プラグインには、証明書利用者の値 (LoginToRP) を設定するための新しいパラメータがあります。

  • AWS ライブラリの更新。

バグ修正:

  • SQLPrepare() メソッドの送信に失敗した場合における、プリペアドステートメントの割り当て解除の失敗。

  • C 型を SQL 型に変換する場合における、プリペアドステートメントパラメータのバインドエラー。

  • EXPLAIN および EXPLAIN ANALYZE クエリが SQLPrepare() および SQLExecute() を使用した場合における、データが返されないエラー。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「ODBC で Amazon Athena に接続する」を参照してください。

2023 年 5 月 8 日

公開日: 2023 年 5 月 8 日

Athena は、次の修正と改善を発表しました。

  • Hudi 統合の更新 – Athena は、Apache Hudi との統合を更新しました。Athena を使用して Hudi 0.12.2 テーブルをクエリできるようになり、Hudi テーブルの Hudi メタデータのリストがサポートされるようになりました。詳細については、「Apache Hudi データセットをクエリする」および「Hudi メタデータを使用してパフォーマンスを改善する」を参照してください。

  • タイムスタンプ変換の修正 - 精度の低いデータ型へのタイムスタンプ変換の処理を修正しました。以前は、Athena エンジンバージョン 3 は、キャスト中に値を切り捨てるのではなく、ターゲットタイプに誤って丸めていました。

    次の例は、修正前の誤った処理を示しています。

    例 1: マイクロ秒単位のタイムスタンプからミリ秒単位へのキャスト

    サンプルデータ

    A, 2020-06-10 15:55:23.383 B, 2020-06-10 15:55:23.382 C, 2020-06-10 15:55:23.383345 D, 2020-06-10 15:55:23.383945 E, 2020-06-10 15:55:23.383345734 F, 2020-06-10 15:55:23.383945278

    次のクエリは、特定の値に一致するタイムスタンプの取得を試みます。

    SELECT * FROM table WHERE timestamps.col = timestamp'2020-06-10 15:55:23.383'

    クエリは次の結果を返しました。

    A, 2020-06-10 15:55:23.383 C, 2020-06-10 15:55:23.383 E, 2020-06-10 15:55:23.383

    修正前は、Athena に値 2020-06-10 15:55:23.383945 または 2020-06-10 15:55:23.383945278 が含まれていません。これは、この値が 2020-06-10 15:55:23.384 に丸められていたためです。

    例 2: タイムスタンプから日付へのキャスト

    次のクエリは誤った結果を返していました。

    SELECT date(timestamp '2020-12-31 23:59:59.999')

    結果

    2021-01-01

    修正前は、Athena が値を切り上げていたため、日付が進んでいました。このような値は、切り上げるのではなく、切り捨てられるようになりました。

2023 年 4 月 28 日

公開日: 2023 年 4 月 28 日

Amazon Athena でキャパシティ予約を使用して、フルマネージドコンピューティング性能で SQL クエリを実行できるようになりました。

プロビジョンドキャパシティのワークロード管理機能により、最も重要なインタラクティブなワークロードの優先順位付け、制御、スケーリングを行えます。いつでも容量を追加して、同時に実行するクエリの数を増やしたり、そのキャパシティを使用するワークロードを制御したり、ワークロード間でキャパシティを共有したりできます。

詳細については、「クエリ処理キャパシティを管理する」を参照してください。料金の詳細については、「Amazon Athena 料金表」ページを参照してください。

2023 年 4 月 17 日

公開日: 2023 年 4 月 17 日

Athena は、JDBC ドライバーのバージョン 2.0.36 をリリースします。ドライバーに新機能を追加し、問題を解決しました。

新機能

  • AD FS 認証でカスタマイズ可能な依存パーティ識別子を使用できるようになりました。

  • コネクタを使用しているアプリケーションの名前をユーザーエージェント文字列に追加できるようになりました。

解決された問題

  • getSchema() が存在しないスキーマの取得に使用されたときに発生したエラーを修正しました。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。

2023 年 4 月 14 日

公開日: 2023 年 6 月 20 日

Athena は、次の修正と改善を発表しました。

  • 文字列をタイムスタンプにキャストする場合、日付と時刻またはタイムゾーンの間にスペースが必要です。詳細については、「文字列からタイムスタンプにキャストする際に日付と時刻の値の間に必要なスペース」を参照してください。

  • タイムスタンプの精度の処理方法において、互換性を失う可能性のある変更を削除しました。Athena エンジンバージョン 2 と Athena エンジンバージョン 3 との整合性を維持するために、タイムスタンプの精度は、デフォルトでマイクロ秒ではなくミリ秒単位を使用するようになりました。

  • Athena は、クエリを実行するときに、クエリ出力バケットへのアクセスを常時強制するようになりました。StartQueryExecution アクションを実行するすべての IAM プリンシパルが、クエリ出力バケットに対する S3:GetBucketLocation 権限を持っていることを確認してください。

2023 年 4 月 4 日

公開日: 2023 年 4 月 4 日

Amazon Athenaを使用して、フェデレーティッドデータソースでビューを作成してクエリできるようになりました。1 つのフェデレーティッドビューを使用して、複数の外部テーブルまたはデータのサブセットをクエリできます。これにより、必要な SQL が簡略化され、SQL を使用してデータをクエリする必要があるエンドユーザーからのデータソースを柔軟に難読化できます。

詳細については、ビューを使用するおよびフェデレーティッドクエリを使用するを参照してください。

2023 年 3 月 30 日

公開日: 2023 年 3 月 30 日

Amazon Athena からのお知らせとして、 Amazon Athena for Apache Spark を利用できる AWS リージョン が追加されました。

このリリースでは、Amazon Athena for Apache Spark の提供地域を、アジアパシフィック (ムンバイ)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、欧州 (フランクフルト) に拡大します。

Amazon Athena for Apache Spark の詳細については、「Amazon Athena で Apache Spark を使用する」を参照してください。

2023 年 3 月 28 日

公開日: 2023 年 3 月 28 日

Athena は、次の修正と改善を発表しました。

  • GetQueryExecutionBatchGetQueryExecution Athena API アクションに対応して、新しい subStatementType フィールドには、実行されたクエリのタイプ (SELECTINSERTUNLOADCREATE_TABLECREATE_TABLE_AS_SELECT など) が表示されます。

  • Apache Hive の書き込み操作でマニフェストファイルが正しく暗号化されなかったバグを修正しました。

  • Athena エンジンバージョン 3 は approx_percentile 関数内の NaN および Infinity 値を正しく処理するようになりました。この approx_percentile 関数は、指定されたパーセンテージでデータセットの近似パーセンタイルを返します。

    Athena エンジンバージョン 2 では、NaNInfinity より大きい値として誤って処理します。Athena エンジンバージョン 3 では、NaN および Infinity の扱いを、他の分析関数や統計関数における扱いに従って処理します。以下で、新しい動作について詳しく説明します。

    • NaN がデータセットに存在する場合、Athena は NaN を返します。

    • NaN が存在せず Infinity が存在する場合、Athena は Infinity を非常に大きな数として扱います。

    • Infinity 値が複数存在する場合、Athena はそれらを非常に大きな、同一の数として扱います。必要に応じて、Athena は Infinity を出力します。

    • 1 つのデータセットに -Infinity-Double.MAX_VALUE が両方含まれ、パーセンタイルの結果が -Double.MAX_VALUE の場合、Athena は -Infinity を返します。

    • 1 つのデータセットに InfinityDouble.MAX_VALUE が両方含まれ、パーセンタイルの結果が Double.MAX_VALUE の場合、Athena は Infinity を返します。

    • InfinityNaN を計算から除外するには、次の例のように is_finite() 関数を使用します。

      approx_percentile(x, 0.5) FILTER (WHERE is_finite(x))

2023 年 3 月 27 日

公開日: 2023 年 3 月 27 日

Amazon Athena の Athena SQL ワークグループに対して、最小レベルの暗号化を指定できるようになりました。この機能により、Athena SQL ワークグループのすべてのクエリの結果が、指定した暗号化レベル以上で暗号化されます。暗号化強度を複数レベルから選択し、データを保護できます。暗号化レベルの下限を設定するには、Athena コンソール、AWS CLI、API、または SDK を使用します。

Apache Spark 対応のワークグループでは、暗号化の下限設定機能は使用できません。詳細については、「ワークグループの最低限の暗号化を設定する」を参照してください。

2023 年 3 月 17 日

公開日: 2023 年 3 月 17 日

Athena は、次の修正と改善を発表しました。

  • Amazon Athena DynamoDB コネクタで、「KeyConditionExpressions にはキーごとに 1 つの条件のみ含める必要があります」というエラーメッセージが表示されてクエリが失敗する問題を修正しました。

    この問題が発生するのは、Athena エンジンバージョン 3 では、Athena エンジンバージョン 2 よりも多くの種類の述語をプッシュダウンする可能性があるためです。Athena エンジンバージョン 3 では、some_column LIKE 'someprefix% のような句は、特定の列に下限と上限を適用するフィルター述語としてプッシュダウンされます。Athena エンジンのバージョン 2 では、これらの述語がプッシュダウンされることはありませんでした。Athena エンジンバージョン 3 では、some_column がソートキー列の場合、エンジンはフィルター述語を DynamoDB コネクタにプッシュダウンします。その後、フィルター述語はさらに DynamoDB サービスにプッシュダウンされます。DynamoDB はソートキーに対して複数のフィルター条件をサポートしていないため、DynamoDB はエラーを返します。

    この問題を修正するには、Amazon Athena DynamoDB コネクタをバージョン 2023.11.1 に更新してください。コネクタを更新する手順については、「データソースコネクタを更新する」を参照してください。

2023 年 3 月 8 日

公開日: 2023 年 3 月 8 日

Athena は、次の修正と改善を発表しました。

  • タイムスタンプ述語値がミリ秒ではなくマイクロ秒で送信されるフェデレーティッドクエリの問題を修正しました。

2023 年 2 月 15 日

公開日: 2023 年 2 月 15 日

Athena は、次の修正と改善を発表しました。

  • クライアント側の暗号化を使用して Amazon S3 のデータを暗号化し、Iceberg 書き込みオペレーションを実行できるようになりました。

  • Amazon S3 の Iceberg 書き込みオペレーションに関して、サーバー側の暗号化に影響する問題を修正しました。

2023 年 1 月 31 日

公開日: 2023 年 1 月 31 日

Amazon Athena を使用して、Google Cloud Storage 内のデータをクエリできるようになりました。Amazon S3 と同様に、Google Cloud Storage とはデータをバケットに保存するマネージドサービスです。Google Cloud Storage の Athena コネクタを使用して、外部データでインタラクティブなフェデレーションクエリを実行します。

詳細については、「Amazon Athena Google Cloud Storage コネクタ」を参照してください。

2023 年 1 月 20 日

公開日: 2023 年 1 月 20 日

Athena の圧縮サポートの拡張ドキュメントが表示できるようになりました。Hive テーブル圧縮Iceberg テーブル圧縮 および ZSTD 圧縮レベル に個別のトピックは追加されました。

詳細については、「Athena で圧縮を使用する」を参照してください。

2023 年 1 月 3 日

公開日: 2023 年 1 月 3 日

Athena は、次の更新を発表しました。

  • Hive メタストア用の追加コマンド - Athena を使用すると、自己管理型の Apache Hive メタストアにメタデータカタログとして接続し、Amazon S3 に保存されているデータをクエリできます。今回のリリースでは、CREATE TABLE AS (CTAS)、INSERT INTO および 12 個の追加データ定義言語 (DDL) コマンドを使用して Apache Hive メタストアを操作できるようになりました。この拡張された SQL 機能セットを使用して、Athena から Hive メタストアのスキーマを直接管理できます。

    詳細については、「外部の Hive メタストアを使用する」を参照してください。

  • JDBC ドライバーのバージョン 2.0.35 - Athena が JDBC ドライバーのバージョン 2.0.35 をリリースします。JDBC 2.0.35 ドライバーには、次の更新が含まれています。

    • ドライバーは Jackson JSON パーサーに対して次のライブラリを使用するようになりました。

      • jackson-annotations 2.14.0 (以前は 2.13.2)

      • jackson-core 2.14.0 (以前は 2.13.2)

      • jackson-databind 2.14.0 (以前は 2.13.2.2)

    • JDBC バージョン 4.1 のサポートは中止されました。

    詳細については、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。

Athena リリースノート (2022 年)

2022 年 12 月 14 日

公開日: 2022 年 12 月 14 日

Kafka 用 Amazon Athena コネクタを使用して、ストリーミングデータに対する SQL クエリを実行できるようになりました。たとえば、Amazon Managed Streaming for Apache Kafka (Amazon MSK) でリアルタイムストリーミングデータに対して分析クエリを実行し、Amazon S3 のデータレイクの履歴データと結合できます。

Kafka 用 Amazon Athena コネクタは、複数のストリーミングエンジンでのクエリをサポートします。Athena を使用すると、Amazon MSK でプロビジョニングされたサーバーレスクラスタ、セルフマネージドの Kafka デプロイ、および Confluent Cloud のストリーミングデータで SQL クエリを実行できます。

詳細については、「Amazon Athena MSK コネクタ」を参照してください。

2022 年 12 月 2 日

公開日: 2022 年 12 月 2 日

Athena は、JDBC ドライバーのバージョン 2.0.34 をリリースします。JDBC 2.0.34 ドライバーには、次の新機能と解決された問題が含まれています。

  • クエリ結果の再利用のサポート - クエリを実行するたびに Athena に結果を再計算させる代わりに、以前に実行したクエリの結果を指定した制限時間まで再利用できるようになりました。詳細については、JDBC のダウンロードページから入手できる「インストールおよび設定ガイド」と「Athena でクエリ結果を再利用する」を参照してください。

  • EC2InstanceMetadata サポート - JDBC ドライバーは、IAM インスタンスプロファイルを使用する Ec2InstanceMetadata 認証方法をサポートするようになりました。

  • 文字ベースの例外の修正 - 特定の言語文字を含むクエリで発生した例外を修正しました。

  • 脆弱性の修正 - コネクタにパッケージされた AWS 依存関係に関連する脆弱性を修正しました。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。

2022 年 11 月 30 日

公開日: 2022 年 11 月 30 日

Athena で Apache Spark アプリケーションと Jupyter 互換ノートブックをインタラクティブに作成および実行できるようになりました。リソースの計画、設定、または管理を行うことなく、Spark を使用して Athena でデータ分析を実行します。処理用の Spark コードを送信し、結果を直接受け取ります。Amazon Athena コンソールのシンプルなノートブックエクスペリエンスを使用して、Python または Athena ノートブック API を使用する を使用して Apache Spark アプリケーションを開発できます。

Amazon Athena の Apache Spark はサーバーレスであり、オンデマンドで自動的にスケーリングされるため、データ量や処理要件の変化に合わせて瞬時に処理できます。

詳細については、「Amazon Athena で Apache Spark を使用する」を参照してください。

2022 年 11 月 18 日

公開日: 2022 年 11 月 18 日

IBM Db2 用の Amazon Athena コネクタを使用して Athena から Db2 をクエリできるようになりました。たとえば、Db2 上のデータウェアハウス、および Amazon S3 内のデータレイクに対して分析クエリを実行できます。

Amazon Athena Db2 コネクタは、Lambda 環境変数を使用して、いくつかの設定オプションを公開します。設定オプション、パラメータ、接続文字列、デプロイ、および制限事項については、「Amazon Athena IBM Db2 コネクタ」を参照してください。

2022 年 11 月 17 日

公開日: 2022 年 11 月 17 日

Athena エンジンのバージョン 3 の Apache Iceberg サポートでは、次の強化された ACID トランザクション機能が提供されるようになりました。

  • ORC と Avro のサポート - Apache AvroApache ORC の行および列ベースのファイル形式を使用して Iceberg テーブルを作成できます。これらの形式に対するサポートは、Parquet 向けの既存のサポートに追加されます。

  • MERGE INTO - MERGE INTO コマンドを使用して、大規模なデータを効率的にマージします。MERGE INTOINSERTUPDATE、および DELETE のオペレーションを 1 つのトランザクションにまとめます。これにより、データパイプラインの処理オーバーヘッドが軽減され、SQL の記述も少なくなります。詳細については、Iceberg テーブルデータを更新するおよびMERGE INTOを参照してください。

  • CTAS と VIEW のサポート - CREATE TABLE AS SELECT (CTAS) および CREATE VIEW ステートメントを Iceberg テーブルで使用します。詳細については、CREATE TABLE ASおよびCREATE VIEW および CREATE DIALECT VIEWを参照してください。

  • VACUUM サポート - VACUUM ステートメントを使用して、不要になったスナップショットやデータを削除することで、データレイクを最適化できます。この機能を使用すると、読み込みパフォーマンスを向上し、GDPR などのルールの要件を満たすことができます。詳細については、Iceberg テーブルを最適化するおよびVACUUMを参照してください。

これらの新機能には Athena エンジンバージョン 3 が必要であり、Athena がサポートされているすべてのリージョンで利用できます。これらは Athena コンソールドライバー、または API で使用できます。

Athena での Iceberg の使用に関する詳細については、「Apache Iceberg テーブルをクエリする」を参照してください。

2022 年 11 月 14 日

公開日: 2022 年 11 月 14 日

Amazon Athena は、IPv6 経由で Athena 関数を呼び出すために使用できるインバウンド接続用の IPv6 エンドポイントをサポートするようになりました。この機能を使用して、IPv6 コンプライアンス要件を満たすことができます。また、IPv4 と IPv6 間のアドレス変換を処理するための追加のネットワーク機器が不要になります。

この機能を使用するには、IPv4 と IPv6 の両方をサポートする新しい Athena デュアルスタックエンドポイントを使用するようにアプリケーションを設定します。デュアルスタックのエンドポイントは、形式 athena.region.api.aws を使用します。たとえば、米国東部 (バージニア北部) リージョンのデュアルスタックのエンドポイントは athena.us-east-1.api.aws です。

デュアルスタックの Athena エンドポイントにリクエストを行うと、エンドポイントは、ネットワークとクライアントが使用するプロトコルに応じて IPv6 または IPv4 アドレスに解決されます。プログラムにより AWS サービスに接続するには、AWS CLI または AWS SDK を使用してエンドポイントを指定できます。

サービスエンドポイントの詳細については、「AWS サービスエンドポイント」を参照してください。Athena のサービスエンドポイントの詳細については、AWS ドキュメントの「Amazon Athena エンドポイントとクォータ」を参照してください。

インバウンド接続に新しい Athena デュアルスタックエンドポイントを追加料金なしで使用できます。デュアルスタックのエンドポイントは、一般的にすべての AWS リージョン で使用できます。

2022 年 11 月 11 日

公開日: 2022 年 11 月 11 日

Athena は、次の修正と改善を発表しました。

  • Lake Formation のきめ細かいアクセス制御の拡張 - サポートされている任意のファイルまたはテーブル形式で保存されているデータに対して、Athena クエリで AWS Lake Formation のきめ細かいアクセス制御ポリシーを使用できるようになりました。データフィルターを使用してクエリ結果のデータへのアクセスを制限し、列レベル、行レベル、およびセルレベルのセキュリティを実現するために、Lake Formation では、きめ細かなアクセスコントロールを使用できます。Athena でサポートされているテーブル形式には、Apache Iceberg、Apache Hudi、Apache Hive などがあります。Athena がサポートするすべてのリージョンで、きめ細かなアクセス制御を使用できます。新しい機能が提供され、クエリのパフォーマンスが向上する、拡張されたテーブルとファイル形式のサポートには Athena エンジンバージョン 3 が必須ですが、Lake Formation でのきめ細かいアクセス制御ポリシーのセットアップ方法は変わりません。

    この拡張されたきめ細かいアクセス制御を Athena で使用する場合、次の考慮事項があります。

    • 説明 - Lake Formation で定義されている行またはセルのフィルタリング情報とクエリ統計情報は、EXPLAIN および EXPLAIN ANALYZE の出力に表示されません。Athena の EXPLAIN については、「Athena での EXPLAIN および EXPLAIN ANALYZE の使用」を参照してください。

    • 外部 Hive メタストア - Apache Hive の非表示列はきめ細かいアクセス制御フィルタリングには使用できません。また、Apache Hive の非表示システムテーブルはきめ細かなアクセス制御ではサポートされていません。詳細については、トピック「外部の Hive メタストアを使用する」の「考慮事項と制限事項」を参照してください。

    • クエリ統計 - Lake Formation で行レベルのフィルターが定義されている場合、ステージレベルの入出力行数とデータサイズ情報は Athena クエリ統計に表示されません。Athena クエリの統計情報を表示する方法については、「完了したクエリの統計と実行の詳細を表示する」および「getQueryRuntimeStatistics」を参照してください。

    • ワークグループ - 同じ Athena ワークグループのユーザーは、Lake Formation のきめ細かいアクセス制御によって、ワークグループがアクセスできるように設定したデータを見ることができます。Athena を使用して Lake Formation に登録されたデータをクエリする方法については、「Athena を使用して AWS Lake Formation に登録されたデータをクエリする」を参照してください。

    Lake Formation でのきめ細かなアクセス制御の使用方法については、「AWS ビッグデータブログ」の「AWS Lake Formation を使用したきめ細かなアクセス制御の管理」を参照してください。

  • Athena フェデレーションクエリ - Athena フェデレーションクエリでは、struct オブジェクト内のフィールド名の元の大文字と小文字が保持されるようになりました。以前は、struct フィールド名は自動的に小文字になっていました。

2022 年 11 月 8 日

公開日: 2022 年 11 月 8 日

クエリ結果の再利用キャッシュ機能を使用して、Athena でのクエリの繰り返しを高速化できるようになりました。リピートクエリは、最近送信されたクエリと同じ SQL クエリであり、同じ結果が得られます。複数の同じクエリを実行する必要がある場合、結果を再利用するキャッシュを使用すると、結果の生成に必要な時間を短縮できます。結果再利用キャッシュにより、スキャンされるバイト数を減らすことでコストも削減されます。

詳細については、「Athena でクエリ結果を再利用する」を参照してください。

2022 年 10 月 13 日

公開日: 2022 年 10 月 13 日

Athena は、Athena エンジンバージョン 3 を発表しました。

Athena では、SQL クエリエンジンがアップグレードされ、Trino オープンソースプロジェクトの最新機能が利用できるようになりました。Athena エンジンバージョン 2 のすべての機能をサポートしているのに加え、Athena エンジンバージョン 3 には、50 以上の新しい SQL 関数、30 の新機能、90 を超えるクエリパフォーマンスの改善が含まれています。本日のリリースで、オープンソースソフトウェア管理に対する継続的な統合アプローチも Athena に導入されました。これにより、Trino と Presto のプロジェクトの流通性が向上するため、Athena エンジン内で統合、チューニングされたコミュニティの改善にすばやくアクセスできるようになります

詳細については、「Athena エンジンバージョン 3」を参照してください。

2022 年 10 月 10 日

公開日: 2022 年 10 月 10 日

Athena は、JDBC ドライバーのバージョン 2.0.33 をリリースします。JDBC 2.0.33 ドライバーには、次の変更が含まれています。

  • 新しいドライバーバージョン、JDBC バージョン、およびプラグイン名のプロパティが、認証情報プロバイダクラスのユーザーエージェント文字列に追加されました。

  • エラーメッセージが修正され、必要な情報が追加されました。

  • 接続が閉じられたり、Athena のプリペアドステートメントの実行が失敗したりすると、プリペアドステートメントの割り当てが解除されるようになりました。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。

2022 年 9 月 23 日

公開日: 2022 年 9 月 26 日

Amazon Athena Neptune コネクタは、列名とテーブル名の大文字と小文字を区別しない照合をサポートするようになりました。

  • Neptune データソースコネクタは、AWS Glue のテーブルの列名がすべて小文字であっても、大文字と小文字を使用する Neptune テーブルの列名を解決できます。  この動作を有効にするには、Neptune コネクタの Lambda 関数で enable_caseinsensitivematch 環境変数を true に設定します。

  • AWS Glue は小文字のテーブル名のみをサポートしているため、Neptune 用の AWS Glue テーブルを作成する場合は、AWS Glue テーブルパラメータ "glabel" = table_name を指定します。

Neptune コネクタの詳細については、「Amazon Athena Neptune コネクタ」を参照してください。

2022 年 9 月 13 日

公開日: 2022 年 9 月 13 日

Athena は、次の修正と改善を発表しました。

  • 外部 Hive メタストア外部 Hive メタストア (EHMS) に存在しないパーティションが WHERE 句に含まれている場合、Athena で例外をスローする代わりに NULL を返すようになりました。  新しい動作は AWS Glue Data Catalog の動作と一致します。

  • パラメータ化されたクエリパラメータ化されたクエリの値を DOUBLE データ型にキャストできるようになりました。

  • Apache Iceberg — Amazon S3 バケットで Object Lock が有効である場合に、Iceberg テーブルに書き込みオペレーションができるようになりました。

2022 年 8 月 31 日

公開日: 2022 年 8 月 31 日

Amazon Athena では、アジアパシフィック (ジャカルタ) リージョンで Athena とその機能が利用可能になりました。

このリリースで、アジアパシフィックでの Athena の提供が拡張され、アジアパシフィック (香港)、アジアパシフィック (ジャカルタ)、アジアパシフィック (ムンバイ)、アジアパシフィック (大阪)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、およびアジアパシフィック (東京) が含まれるようになりました。これらのリージョンや他のリージョンで利用可能な AWS のサービス の詳細な一覧については、「AWS リージョン 別のサービス表」を参照してください。

2022 年 8 月 23 日

公開日: 2022 年 8 月 23 日

Athena Query Federation SDK のリリース v2022.32.1 には、次の変更が含まれています。

  • Amazon RDS インスタンスへの SSL ベースの接続用に、Amazon Athena Oracle データソースコネクタのサポートが追加されました。このサポートは、Transport Layer Security (TLS) プロトコルと、クライアントによるサーバーの認証に限定されています。相互認証は Amazon RDS でサポートされていないため、相互認証のサポートは更新に含まれていません。

    詳細については、「Amazon Athena Oracle コネクタ」を参照してください。

2022 年 8 月 3 日

公開日: 2022 年 8 月 3 日

Athena で、JDBC ドライバーのバージョン 2.0.32 がリリースされます。JDBC 2.0.32 ドライバーには、次の変更が含まれています。

  • Athena SDK に送信される User-Agent 文字列が、ドライバーのバージョン、JDBC 仕様のバージョン、認証プラグインの名前を含むように拡張されました。

  • CheckNonProxyHost パラメータに値が提供されていない場合にスローされる NullPointerException を修正しました。

  • BrowserSAML 認証プラグインでの login_url 解析に関する問題を修正しました。

  • UseProxyforIdp パラメータが true に設定された場合に発生するプロキシのホストの問題を修正しました。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。

2022 年 8 月 1 日

公開日: 2022 年 8 月 1 日

Athena が Athena Query Federation SDK と Athena の事前構築済みデータソースコネクタの改善を発表しました。改善には次が含まれます。

  • 構造体の解析 – 特定の複雑な構造体がすべてのデータを表示できないという Athena Query Federation SDK の GlueFieldLexer の解析の問題を修正しました。この問題は、Athena Query Federation SDK 上に構築されたコネクタに影響を与えました

  • AWS Glue テーブル – AWS Glue テーブルの set および decimal の列タイプのサポートがさらに追加されました。

  • DynamoDB コネクタ – DynamoDB 属性名の大文字と小文字を無視する機能が追加されました。詳細については、Amazon Athena DynamoDB コネクタ ページの パラメータ セクションにある「disable_projection_and_casing」を参照してください。

詳細については、GitHub の「Release v2022.30.2 of Athena Query Federation」(Athena Query Federation のリリース v2022.30.2) を参照してください。

2022 年 7 月 21 日

公開日: 2022 年 7 月 21 日

Athena コンソールで、パフォーマンスメトリクスとインタラクティブで視覚的なクエリ分析ツールを使用して、クエリを分析およびデバッグできるようになりました。クエリのパフォーマンスデータと実行の詳細は、クエリのボトルネックの特定、クエリの各ステージの演算子と統計の検査、ステージ間を流れるデータ量の追跡、クエリ述語の影響の検証に役立ちます。これで、次の操作を実行できます。

  • 1 回クリックするだけで、クエリの分散型および論理実行プランにアクセスできます。

  • ステージが実行される前に、各ステージでのオペレーションを詳しく確認します。

  • キュー、計画、実行の各段階で費やされた時間のメトリクスを使用して、完了したクエリのパフォーマンスを視覚化します。

  • クエリで処理および出力されたソースデータの行数と量に関する情報を取得します。

  • コンテキストで示され、インタラクティブなグラフとしてフォーマットされたクエリのきめ細かい実行の詳細を表示します。

  • ステージレベルの正確な実行の詳細を使用して、クエリを通じたデータの流れを理解します。

  • 新しい API を使用してプログラムでクエリパフォーマンスデータを分析し、クエリランタイム統計を取得します。これも本日リリースされました。

クエリでこれらの機能を使用する方法については、AWS YouTube チャンネルの動画のチュートリアル「Optimize Amazon Athena Queries with New Query Analysis Tools」(新しいクエリ分析ツールを使用して Amazon Athena クエリを最適化する) をご覧ください。

ドキュメントについては、「SQL クエリの実行プランを表示する」および「完了したクエリの統計と実行の詳細を表示する」を参照してください。

2022 年 7 月 11 日

公開日: 2022 年 7 月 11 日

SQL ステートメントを事前に準備することなく、パラメータ化されたクエリを Athena コンソールまたは API から直接実行できるようになりました。

疑問符形式のパラメータを含むクエリを Athena コンソールで実行すると、パラメータの値を直接入力することを促すプロンプトがユーザーインターフェイスで表示されるようになりました。これにより、クエリを実行するたびにクエリエディタでリテラル値を変更する必要がなくなります。

強化された query execution API を使用する場合、1 回の呼び出しで実行パラメータとその値を指定できるようになりました。

詳細については、このユーザーガイドの「パラメータ化されたクエリを使用する」と「AWS ビッグデータブログ」の記事「Amazon Athena のパラメータ化されたクエリを使用して Data as a Service (DaaS) を提供する」を参照してください。

2022 年 7 月 8 日

公開日: 2022 年 7 月 8 日

Athena は、次の修正と改善を発表しました。

  • クエリの失敗を引き起こしていた SageMaker エンドポイント (UDF) の DATE 列変換処理の問題を修正しました。

2022 年 6 月 6 日

公開日: 2022 年 6 月 6 日

Athena が JDBC ドライバーのバージョン 2.0.31 をリリース。JDBC 2.0.31 ドライバーには、次の変更が含まれています。

  • log4j 依存関係の問題 — log4j 依存関係によって引き起こされる「ドライバークラスが見つからない」エラーメッセージを解決しました。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。

2022 年 5 月 25 日

公開日: 2022 年 5 月 25 日

Athena は、次の修正と改善を発表しました。

  • Iceberg のサポート

    • クロスリージョンクエリのサポートが導入されました。これにより、使用している AWS リージョンとは異なる AWS リージョンにある Iceberg テーブルをクエリできるようになりました。クロスリージョンクエリは、中国リージョンではサポートされていません。

    • サーバー側暗号化設定のサポートが導入されました。これにより、Amazon S3 での Iceberg 書き込み操作からのデータの暗号化に SSE-S3/SSE-KMS を使用できるようになりました。

    Athena での Apache Iceberg の使用に関する詳細については、「Apache Iceberg テーブルをクエリする」を参照してください。

  • JDBC 2.0.30 ドライバーリリース

    Athena 用の JDBC 2.0.30 ドライバーでは、以下の点が改善されました。

    • パラメータ化されたプリペアドステートメントに影響を及ぼしていたデータ競合の問題を修正。

    • Gradle ビルド環境で発生していたアプリケーションの起動問題を修正。

    JDBC 2.0.30 ドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。

2022 年 5 月 6 日

公開日: 2022 年 5 月 6 日

Athena 用の JDBC 2.0.29 ドライバー と ODBC 1.1.17 ドライバーがリリースされました。

これらのドライバーには、以下の変更が含まれます。

  • SAML プラグインブラウザの起動プロセスを更新しました。

これらの変更についての詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」および「ODBC で Amazon Athena に接続する」を参照してください。

2022 年 4 月 22 日

公開日: 2022 年 4 月 22 日

Athena は、次の修正と改善を発表しました。

  • 次の条件が満たされたときにパーティションキャッシュで発生していた、パーティションインデックスとフィルタリング機能の問題を修正しました。

    • テーブルの AWS Glue テーブルプロパティで partition_filtering.enabled キーが true に設定されている。

    • 同じテーブルが異なるパーティションフィルター値で複数回使用されている。

2022 年 4 月 21 日

公開日: 2022 年 4 月 21 日

Amazon Athena を使用して、Google BigQuery、Azure Synapse、Snowflake などの新しいデータソースに対してフェデレーティッドクエリを実行できるようになりました。新しいデータソースコネクタには、次のものがあります。

Athena でサポートされるデータソースの完全なリストについては、「使用可能なデータソースコネクタ」を参照してください。

使用可能なソースを参照してデータに接続しやすくなるように、Athena コンソールの新しくなった [Data Sources] (データソース) 画面から使用可能なコネクタを検索、並べ替え、およびフィルターできるようになりました。

フェデレーティッドソースに対するクエリについては、「Amazon Athena 横串検索を使用する」および「フェデレーティッドクエリを使用する」を参照してください。

2022 年 4 月 13 日

公開日: 2022 年 4 月 13 日

Athena は JDBC ドライバーのバージョン 2.0.28 をリリースします。JDBC 2.0.28 ドライバーには、次の変更が含まれています。

  • JWT のサポート - ドライバーが、認証に使用される JSON ウェブトークン (JWT) をサポートするようになりました。JDBC ドライバーでの JWT の使用については、「JDBC ドライバーページ」からダウンロードできるインストールと設定のガイドを参照してください。

  • Log4j ライブラリの更新 - JDBC ドライバーが、次の Log4j ライブラリを使用するようになりました。

    • Log4j-API 2.17.1 (以前は 2.17.0)

    • Log4j-core 2.17.1 (以前は 2.17.0)

    • Log4j-jcl 2.17.2

  • その他の改善点 - 新しいドライバーには、以下の改善とバグ修正も含まれています。

    • JDBC を通じて Athena 準備済みステートメント機能を使用できるようになりました。準備済みステートメントについては、「パラメータ化されたクエリを使用する」を参照してください。

    • 中国リージョンで Athena JDBC SAML フェデレーションが機能するようになりました。

    • その他の小さな改善。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。

2022 年 3 月 30 日

公開日: 2022 年 3 月 30 日

Athena は、次の修正と改善を発表しました。

  • クロスリージョンクエリ— Athena を使用して、アジアパシフィック (香港)、中東 (バーレーン)、アフリカ (ケープタウン)、欧州 (ミラノ) を含む AWS リージョン 全体で Amazon S3 バケット内のデータをクエリできるようになりました。クロスリージョンクエリは、中国リージョンではサポートされていません。

2022 年 3 月 18 日

公開日: 2022 年 3 月 18 日

Athena は、次の修正と改善を発表しました。

  • 動的フィルタリング動的フィルタリングは、対応するテーブルの各レコードにフィルタを効率的に適用することで、整数列に対して改善されました。

  • Iceberg – 2GB を超える Iceberg Parquet ファイルを書き込むときにエラーが発生する問題を修正しました。

  • 非圧縮出力CREATE TABLE ステートメントが、非圧縮ファイルの書き込みをサポートするようになりました。非圧縮ファイルを書き込むには、次の構文を使用します。

    • CREATE TABLE (テキストファイルまたは JSON) – TBLPROPERTIES で、write.compression = NONE を指定します。

    • CREATE TABLE (Parquet) – TBLPROPERTIES で、parquet.compression = UNCOMPRESSED を指定します。

    • CREATE TABLE (ORC) – TBLPROPERTIES で、orc.compress = NONE を指定します。

  • 圧縮 – あるフォーマットで圧縮されたファイルを作成したが、デフォルト以外の圧縮方法を使用したときに、別の圧縮形式のファイル拡張子を使用したテキストファイルテーブルの挿入に関する問題を修正しました。

  • Avro – Avro ファイルから固定タイプの小数点を読み込むときに発生する問題を修正しました。

2022 年 3 月 2 日

公開日: 2022 年 3 月 2 日

Athena は、次の機能と改善点を発表しました。

2022 年 2 月 23 日

公開日: 2022 年 2 月 23 日

Athena は、次の修正とパフォーマンス改善を発表しました。

  • パフォーマンスを向上させ、メモリエラーを削減するためのメモリ処理の改善。

  • Athena は、ストライプフッターに保存されたタイムゾーン情報で ORC タイムスタンプ列を読み込み、タイムゾーン (UTC) を持つ ORC ファイルをフッターに書き込むようになりました。これは、読み込む ORC ファイルが UTC 以外のタイムゾーン環境で作成された場合にのみ、ORC タイムスタンプ読み込みの動作に影響します。

  • 十分最適でないクエリプランが発生するシンボリック リンクテーブルサイズの誤見積もりを修正しました。

  • 水平分解ビューを Hive メタストア データソースから Athena コンソールでクエリできるようになりました。

  • Amazon S3 の読み込みエラーメッセージが改善され、より詳細な Simple Storage Service (Amazon S3) のエラーコード情報が含まれるようになりました。

  • ORC 形式の出力ファイルで Apache Hive 3.1 との互換性がなくなる問題を修正しました。

  • 一部の DML および DDL クエリで、引用符付きのテーブル名が失敗する問題を修正しました。

2022 年 2 月 15 日

公開日: 2022 年 2 月 15 日

Amazon Athena はアクティブな DML クエリクォータをすべての AWS リージョンで増加させました。アクティブなクエリには、実行中のクエリとキューに登録されたクエリの両方が含まれます。この変更により、これまでよりも多くの DML クエリをアクティブ状態にできるようになりました。

Athena のサービスクォータの詳細については、「Service Quotas」を参照してください。Athena を使用するリージョンのクエリクォータについては、「AWS 全般のリファレンス」の「 Amazon Athena エンドポイントとクォータ」を参照してください。

クォータの使用状況をモニタリングするには、CloudWatch の使用状況メトリクスを使用できます。Athena は、AWS/Usage 名前空間に ActiveQueryCount メトリクスを公開します。詳細については、「CloudWatch による Athena 使用状況メトリクスのモニタリング」を参照してください。

使用状況を確認したら、Service Quotas コンソールを使用して、クォータの引き上げをリクエストできます。以前にアカウントのクォータの引き上げをリクエストしたことがある場合は、新しいデフォルトのアクティブな DML クエリクォータを超えた場合にもリクエストされたクォータが適用されます。それ以外の場合は、すべてのアカウントで新しいデフォルトが使用されます。

2022 年 2 月 14 日

公開日: 2022 年 2 月 14 日

このリリースでは、Athena GetQueryExecution API アクションの AthenaError レスポンスオブジェクトに ErrorType サブフィールドが追加されました。

既存の ErrorCategory フィールドは、失敗したクエリの一般的なソース (システム、ユーザー、またはその他) を示しますが、新しい ErrorType フィールドには、発生したエラーに関するより詳細な情報が表示されます。両方のフィールドの情報を組み合わせて、クエリが失敗した原因に関するインサイトを把握します。

詳細については、「Athena エラーカタログ」を参照してください。

2022 年 2 月 9 日

公開日: 2022 年 2 月 9 日

古い Athena コンソールは利用できなくなりました。Athena の新しいコンソールは、以前のコンソールの機能をすべてサポートしています。それでいて使いやすく、最新のインターフェースを備えており、新機能によりクエリの開発、データの分析、使用状況管理の経験が向上します。新しい Athena コンソールを使用するには、https://console.aws.amazon.com/athena にアクセスします。

2022 年 2 月 8 日

公開日: 2022 年 2 月 8 日

バケット所有者 — 追加のセキュリティ対策として、クエリ結果を出力する場所となる Athena のバケットの、所有者 AWS アカウント の ID を、オプションで指定できるようになりました。クエリ結果でのバケット所有者のアカウント ID が、ここで指定したアカウント ID と一致しない場合、Amazon S3 のアクセス許可エラーにより、バケットに出力できません。この設定は、クライアントレベルまたはワークグループレベルで行えます。

詳細については、「クエリ結果の場所を指定する」を参照してください。

2022 年 1 月 28 日

公開日: 2022 年 1 月 28 日

Athena では、次のエンジン機能の強化点を発表しました。

  • Apache Hudi — Hudi Merge on Read (MoR) テーブルに対するスナップショットクエリで、INT64 データ型のタイムスタンプ列の読み込みが可能になりました。

  • UNION クエリ — パフォーマンスが向上し、同じテーブルを何度もスキャンするような特定の UNION クエリの、データスキャンを減らしました。

  • クエリの分離 — フィルターの各パーティション列に対して、分離値のみを含むクエリの、パフォーマンスが向上しました。

  • パーティション射影の強化

    • injected タイプの列に対するフィルター条件として、複数の分離値が許可されるようになりました。詳細については、「挿入型」を参照してください。

    • 分離値のみがフィルターに含まれ、CHARVARCHAR のような文字をベースとしたタイプの列の、パフォーマンスが向上しました。

2022 年 1 月 13 日

公開日: 2022 年 1 月 13 日

Athena 用の JDBC 2.0.27 ドライバー と ODBC 1.1.15 ドライバー がリリースされました。

JDBC 2.0.27 ドライバーには、次の変更が含まれています。

  • 外部カタログを取得するようにドライバが更新されました。

  • 拡張ドライバのバージョン番号は、Athena API コールの一部として、user-agent 文字列に含まれます。

ODBC 1.1.15 ドライバーには、次の変更が含まれています。

  • SQLParamData() への 2 回目の呼び出しに関する問題を修正しました。

これらの変更についての詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」および「ODBC で Amazon Athena に接続する」を参照してください。

Athena リリースノート (2021 年)

2021 年 11 月 26 日

公開日: 2021 年 11 月 26 日

Athena は、Athena ACIDトランザクションのパブリックプレビューを発表しました。Athena の SQL データ操作言語 (DML) に書込み、削除、更新、およびタイムトラベルの操作を追加しました。Athena ACID トランザクションにより、複数のユーザーが、Amazon S3 データに対して信頼性の高い行レベルの変更を、同時に行えます。Apache Iceberg テーブルフォーマット上に構築された Athena ACID トランザクションは、Amazon EMRApache Spark など、Iceberg テーブルフォーマットをサポートしている他のサービスやエンジンと互換性があります。

使い慣れた SQL 構文で Athena ACID トランザクションを行うことで、ビジネスや規制に関するデータの更新が簡素化されます。たとえば、データの消去リクエストに応答する場合は、SQL の DELETE オペレーションを実行します。手動によるレコードの修正には、単一の UPDATE ステートメントを使用します。また、最近削除されたデータを回復する場合は、SELECT ステートメントにより、タイムトラベルクエリを発行します。Athena コンソール、API オペレーション、ODBC および JDBC ドライバー経由で、Athena のトランザクションを利用できます。

詳細については、「Athena ACID トランザクションを使用する」を参照してください。

2021 年 11 月 24 日

公開日: 2021 年 11 月 24 日

Athena は、ZStandard で圧縮された ORC、Parquet、およびテキストファイルのデータに対する読み込みと書き込みをサポートすると発表しました。Athena では、ZStandard で圧縮されたデータを書き込むときに、ZStandard 圧縮レベル 3 を使用します。

Athena でのデータ圧縮の詳細については、「Athena で圧縮を使用する」を参照してください。

2021 年 11 月 22 日

公開日: 2021 年 11 月 22 日

これで Amazon Athena コンソールから AWS Step Functions ワークフローを管理する際に、スケーラブルなデータを処理するパイプラインの構築、カスタムのビジネスロジックに基づくクエリの実行、管理タスクやアラートタスクの自動化などが容易になります。

アップグレードされた Athena コンソール に Step Functions が統合され、これにより Athena を起動するステートマシンのインタラクティブなワークフロー図を表示できます。開始するには、左のナビゲーションパネルから [Workflows] (ワークフロー) を選択します。Athena クエリを持つ既存のステートマシンがある場合は、ステートマシンを選択して、インタラクティブなワークフロー図を表示します。Step Functions を初めて使用する場合は、まず Athena コンソールからサンプルプロジェクトを起動し、ユースケースに合わせてカスタマイズします。

詳細については、Amazon Athena と「AWS Step Functions を使用して ETL パイプラインの構築とオーケストレーションを行う」を参照するか、「Step Functions ドキュメント」を参照してください。

2021 年 11 月 18 日

公開日: 2021 年 11 月 18 日

Athena は、新機能と改善点を発表しました。

  • 次の例で示すような、DISTINCTORDER BY、またその両方を含む集計クエリの、ディスクへのスピルをサポートします。

    SELECT array_agg(orderstatus ORDER BY orderstatus) FROM orders GROUP BY orderpriority, custkey
  • DISTINCT を使用するクエリの、メモリ処理に関する問題を修正しました。DISTINCT クエリを使用した際に、「Query exhausted resources at this scale factor」(このスケールファクターにより、クエリがリソースを使い果たしました) のようなメッセージが表示されないようにするには、DISTINCT のカーディナリティが低い行を選択するか、クエリのデータサイズを減らします。

  • 特定の列を指定しない SELECT COUNT(*) クエリで、行バッファリングなしでカウントのみを保持することで、パフォーマンスとメモリ使用率が向上しました。

  • 次の文字列関数が導入されました。

    • translate(source, from, to)from の文字列を、対応する to の文字列に置き換えた、source 文字列を返します。from の文字列が重複していた場合、最初の文字列だけが使用されます。from 文字列の中に source の文字が無い場合、source の文字は翻訳されずにコピーされます。from 文字列にあるマッチした文字のインデックスが、to 文字列よりも長い場合、その文字は結果として返される文字列から省かれます。

    • concat_ws(string0, array(varchar))string0 を区切り文字として使用して、配列の要素を連結し、その結果を返します。string0 が null である場合、戻り値は null です。配列内の null 値はスキップされます。

  • 欠落している struct のサブフィールドにアクセスしようとすると、クエリが失敗してしまうバグを修正しました。欠落しているサブフィールドについては、クエリが null を返すようになりました。

  • 小数データ型のハッシュが矛盾する問題を修正しました。

  • パーティション内の列が多すぎると、リソースを使い果たしてしまう問題を修正しました。

2021 年 11 月 17 日

公開日: 2021 年 11 月 17 日

Amazon Athena がパーティションのインデックス作成をサポートし、AWS Glue Data Catalog でパーティション化されたテーブルに対するクエリを高速化しました。

パーティション化されたテーブルをクエリする場合、Athena が利用可能なテーブルパーティションを取得し、クエリに関係のあるサブセットをフィルタリングします。新しいデータとパーティションが追加されると、パーティションの処理にかかる時間が長くなり、クエリランタイムも長くなります。Athena がAWS Glue パーティションインデックスをサポートし、パーティション処理が最適化され、高度にパーティション化されたテーブルでのクエリパフォーマンスが向上しました。

詳細については、「AWS Glue パーティションのインデックス作成とフィルタリングでクエリを最適化する」を参照してください。

2021 年 11 月 16 日

公開日: 2021 年 11 月 16 日

新しくなって改善された Amazon Athenaコンソールが、Athena を利用可能な AWS 商用リージョンと GovCloud リージョンで、一般利用可能になりました。Athena の新しいコンソールは、以前のコンソールの機能をすべてサポートしています。それでいて使いやすく、最新のインターフェースを備えており、新機能によりクエリの開発、データの分析、使用状況管理の経験が向上します。これで、次の操作を実行できます。

  • クエリタブバーが再設計され、複数のクエリタブを並べ替え、移動し、閉じることが可能になりました。

  • SQL およびテキストの書式設定が改善され、クエリの読み込みと編集がより簡単になりました。

  • 完全な結果セットのダウンロードに加え、クエリ結果をクリップボードにコピーできるようになりました。

  • クエリ履歴、保存されたクエリ、ワークグループを並べ替え、表示または非表示にする列を選択できるようになりました。

  • シンプルなインターフェイスのおかげで、データソースとワークグループをより少ないクリック数で設定できます。

  • クエリ結果、クエリ履歴、行の折り返しなどの表示に関するプリファレンスを設定できます。

  • キーボードショートカットが新しく改善され、また製品ドキュメントが組み込まれたことにより、生産性を向上できます。

本日の発表で、再設計されたコンソールがデフォルトの設定になりました。あなたの体験についてお伝え頂ける場合は、コンソールの左下隅にある [Feedback] (フィードバック) を選択してください。

必要な場合は、AWS アカウント にログインし、Amazon Athena を選択してから、左のナビゲーションパネルにある [New Athena experience] (新しい Athena エクスペリエンス) の選択を解除すると、以前のコンソールを使用できます。

2021 年 11 月 12 日

公開日: 2021 年 11 月 12 日

Amazon Athena を使用して、自分以外の AWS アカウントにあるデータソースに対し、フェデレーティッドクエリを実行できるようになりました。今日までは、このデータをクエリして、データをクエリしたユーザーと同じ AWS アカウント を使用するには、データソースとそのコネクタが必要でした。

データ管理者としては、データコネクタをデータアナリストのアカウントと共有することで、クロスアカウントのフェデレーティッドクエリを有効にできます。データアナリストとしては、データ管理者が共有してくれたデータコネクタをアカウントに追加できます。発信元アカウントのコネクタに対する設定変更は、共有されたコネクタに自動的に適用されます。

クロスアカウントフェデレーティッドクエリの有効化については、「クロスアカウントフェデレーテッドクエリを有効にする」を参照してください。フェデレーティッドソースに対するクエリについては、「Amazon Athena 横串検索を使用する」および「フェデレーティッドクエリを使用する」を参照してください。

2021 年 11 月 2 日

公開日: 2021 年 11 月 2 日

Athena で EXPLAIN ANALYZE ステートメントを使用して、SQL クエリで分散された実行プランと、それぞれのオペレーションコストを表示できるようになりました。

詳細については、「Athena での EXPLAIN および EXPLAIN ANALYZE の使用」を参照してください。

2021 年 10 月 29 日

公開日: 2021 年 10 月 29 日

Athena が JDBC 2.0.25 ドライバーと ODBC 1.1.13 ドライバーをリリースし、それぞれの機能と改善点を発表します。

JDBC ドライバーおよび ODBC ドライバー

Athena 用の JDBC 2.0.25 ドライバーと ODBC 1.1.13 ドライバーがリリースされました。どちらのドライバーも、任意の SAML 2.0 プロバイダで動作するように構成可能な、ブラウザでの SAML 多要素認証をサポートしています。

JDBC 2.0.25 ドライバーには、次の変更が含まれています。

  • ブラウザでの SAML 認証をサポート。ドライバーには、任意の SAML 2.0 プロバイダーで動作するように構成可能な、ブラウザの SAML プラグインが含まれています。

  • AWS Glue API コールのサポート。GlueEndpointOverride パラメータを使用して、AWS Glue エンドポイントをオーバーライドできます。

  • com.simba.athena.amazonaws クラスパスを、com.amazonaws に変更しました。

ODBC 1.1.13 ドライバーには、次の変更が含まれています。

  • ブラウザでの SAML 認証をサポート。ドライバーには、任意の SAML 2.0 プロバイダーで動作するように構成可能な、ブラウザの SAML プラグインが含まれています。ODBC ドライバーでブラウザの SAML プラグインを使用する例については、「ODBC、SAML 2.0、Okta Identity Provider を使用してシングルサインオンを設定する」を参照してください。

  • ADFS、Azure AD、または Browser Azure AD を認証に使用するときに、ロールのセッション期間を設定できるようになりました。

この詳細や、その他の変更について確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」および「ODBC で Amazon Athena に接続する」を参照してください。

特徴と改善点

Athena は、次の機能と改善点を発表しました。

  • 特定のケースにおいて、テーブルスキャンが重複して行われることを回避するために、新しい最適化ルールが導入されました。

2021 年 10 月 4 日

公開日: 2021 年 10 月 4 日

Athena は、次の機能と改善点を発表しました。

  • SQL OFFSET — SQLの SELECT ステートメントで、OFFSET 句がサポートされるようになりました。詳細については、「SELECT」を参照してください。

  • CloudWatch の使用状況メトリクス — Athena が AWS/Usage 名前空間で、ActiveQueryCount メトリクスを発行するようになりました。詳細については、「CloudWatch による Athena 使用状況メトリクスのモニタリング」を参照してください。

  • クエリ実行計画 — まれに、クエリ実行計画でタイムアウトを引き起こす可能性のあるバグを修正しました。

2021 年 9 月 16 日

公開日: 2021 年 9 月 16 日

Athena は、次の新機能と改善点を発表しました。

機能

  • CTAS において、テキストファイルの指定と、write_compression テーブルプロパティを使用した圧縮 JSON の指定をサポートしました。Parquet 形式および ORC 形式の場合でも、CTAS で write_compression プロパティを指定できます。詳細については、「CTAS テーブルのプロパティ」を参照してください。

  • テキストファイルと JSON ファイルへの書き込みで、BZIP2 圧縮形式がサポートされました。Athena での圧縮形式の詳細については、「Athena で圧縮を使用する」を参照してください。

改良点

  • UDF の Lambda 関数への ID 情報送信が、失敗してしまうバグを修正しました。

  • 分離フィルター条件での、述語プッシュダウンの問題を修正しました。

  • 小数型のハッシュの問題を修正しました。

  • 不要な統計を収集していた問題を修正しました。

  • 一貫性のないエラーメッセージを削除しました。

  • ワーカーノードで動的パーティションプルーニングを適用し、ブロードキャストジョインのパフォーマンスが向上しました。

  • フェデレーティッドクエリ

    • フェデレーティッドクエリ内で CONSTRAINT_VIOLATION エラーの発生を削減するために設定を変更しました。

2021 年 9 月 15 日

公開日: 2021 年 9 月 15 日

再設計された Amazon Athena コンソール (プレビュー) を使用できるようになりました。新しい Athena JDBC ドライバーがリリースされました。

Athena コンソールのプレビュー

Athena が利用可能であれば、どの AWS リージョン からでも再設計された Amazon Athena コンソール (プレビュー) を使用できるようになりました。新しいコンソールは、既存のコンソールのすべての機能をサポートしていますが、より使いやすく、最新のインターフェイスをサポートしています。

新しいコンソールに切り替えるには、AWS アカウント にログインして、Amazon Athena を選択します。AWS コンソールのナビゲーションバーから、[Switch to the new console] (新しいコンソールに切り替える) を選択します。デフォルトのコンソールに戻るには、左のナビゲーションパネルにある [New Athena experience] (新しい Athena エクスペリエンス) の選択を解除します。

新しいコンソールのご利用を開始してください。左下隅にある [Feedback] (フィードバック) から、あなたの体験についてお伝えください。

Athena JDBC ドライバー 2.0.24

Athena は、Athena 用 JDBC ドライバーのバージョン 2.0.24 の利用開始を発表しました。このリリースでは、すべての認証情報プロバイダのプロキシサポートが更新されます。ドライバーは、NonProxyHosts 接続プロパティでサポートされていない、すべてのホストのプロキシ認証をサポートするようになりました。

便宜上、このリリースには、AWS SDK が付属したJDBC ドライバーと、付属しないドライバーの両方のダウンロードが含まれています。この JDBC ドライバーのバージョンには、AWS-SDK と Athena JDBC ドライバーの両方がプロジェクトに埋め込まれています。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。

2021 年 8 月 31 日

公開日: 2021 年 8 月 31 日

Athena では、次の機能強化とバグ修正が行われました。

  • Athena フェデレーション機能の強化 — Athena は、Athena Query Federation SDK の一部として、マッピングタイプのサポートと、複合型に対するサポートを強化しました。このバージョンには、メモリの強化とパフォーマンスの最適化も含まれています。

  • 新しいエラーカテゴリ — エラーメッセージに、USERSYSTEM のエラーカテゴリが導入されました。これらのカテゴリは、自分で修正が可能なエラー (USER) なのか、Athena サポートから支援を受ける必要があるエラー (SYSTEM) なのかを区別するのに役立ちます。

  • フェデレーティッドクエリのエラーメッセージ — フェデレーティッドクエリ関連エラーで、USER_ERROR のカテゴリー分けを更新しました。

  • JOIN — ディスクへのスピル関連のバグとメモリの問題を修正し、JOIN オペレーションにおけるパフォーマンスを向上させ、メモリエラーを減らします。

2021 年 8 月 12 日

公開日: 2021 年 8 月 12 日

Athena 用の ODBC 1.1.12 ドライバーがリリースされました。このバージョンでは、SQLPrepare()SQLGetInfo()、および EndpointOverride 関連の問題が修正されています。

新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「ODBC で Amazon Athena に接続する」を参照してください。

2021 年 8 月 6 日

公開日: 2021 年 8 月 6 日

Amazon Athena では、アジアパシフィック (大阪) リージョンで Athena とその機能が利用可能になりました。

このリリースでは、アジアパシフィックでの Athena の提供が拡張され、アジアパシフィック (香港)、アジアパシフィック (ムンバイ)、アジアパシフィック (大阪)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、およびアジアパシフィック (東京) も含まれるようになりました。これらのリージョンや他のリージョンで利用可能な AWS のサービス の詳細な一覧については、「AWS リージョン 別のサービス表」を参照してください。

2021 年 8 月 5 日

公開日: 2021 年 8 月 5 日

UNLOAD ステートメントを使用して、SELECT クエリの出力を PARQUET、ORC、AVRO、および JSON 形式に書き込めます。

詳細については、「UNLOAD」を参照してください。

2021 年 7 月 30 日

公開日: 2021 年 7 月 30 日

Athena では、次の機能強化とバグ修正が行われました。

  • 動的フィルタリングとパーティションプルーニング - 次の例のように、これらの改善によってパフォーマンスが向上し、特定のクエリでスキャンされるデータ量が削減します。

    この例では、Table_B がパーティション化されていないテーブルで、ファイルサイズが 20 MB 未満であると想定しています。このようなクエリの場合、Table_A から読み込まれるデータがより少なくなり、クエリがより迅速に完了します。

    SELECT * FROM Table_A JOIN Table_B ON Table_A.date = Table_B.date WHERE Table_B.column_A = "value"
  • ORDER BY と LIMIT、DISTINCT と LIMIT - ORDER BY または DISTINCT に続いて LIMIT 句を使用するクエリのパフォーマンスが改善されました。

  • S3 Glacier Deep Archive ファイル - Athena が S3 Glacier Deep Archive ファイルと S3 Glacier 以外のファイルが混在するテーブルをクエリする場合、S3 Glacier Deep Archive ファイルをスキップするようになりました。以前は、これらのファイルをクエリの場所から手動で移動する必要がありました。これを行わないと、クエリが失敗します。Athena を使用して S3 Glacier Deep Archive ストレージ内のオブジェクトをクエリする場合は、それらを元に戻す必要があります。詳細については、「Amazon S3 ユーザーガイド」の「アーカイブされたオブジェクトの復元」を参照してください。

  • CTAS bucketed_by テーブルプロパティによって作成された空のファイルが正しく暗号化されなかったバグを修正しました。

2021 年 7 月 21 日

公開日: 2021 年 7 月 21 日

2021 年 7 月にリリースされた Microsoft Power BI Desktop では、Amazon Athena のネイティブのデータソースコネクタを使用してレポートとダッシュボードを作成できます。Amazon Athena のコネクタは、Power BI の標準コネクタとして利用できます。また、DirectQuery をサポートし、Power BI ゲートウェイを介した大規模なデータセットの分析とコンテンツの更新を可能にします。

コネクタは、既存の ODBC データソース名 (DSN) を使用して Athena に接続してクエリを実行するため、Athena ODBC ドライバーが必要です。最新の ODBC ドライバーをダウンロードする方法は、「ODBC で Amazon Athena に接続する」を参照してください。

詳細については、「Amazon Athena Power BI コネクタを使用する」を参照してください。

2021 年 7 月 16 日

公開日: 2021 年 7 月 16 日

Amazon Athena の Apache Hudi との統合を更新しました。Hudi は、Amazon S3 データレイクの増分データ処理を簡素化するのに使用されるオープンソースのデータ管理フレームワークです。統合を更新することにより、Amazon EMR、Apache Spark、Apache Hive、またはその他の互換性のあるサービスで管理される Hudi 0.8.0 テーブルを、Athena を使用してクエリできます。さらに、Athena は、読み込み時マージ (MoR) テーブルのスナップショットクエリと、ブートストラップされたテーブルの読み込みサポートの 2 つの追加機能をサポートするようになりました。

Apache Hudi は、変更データキャプチャ (CDC) パイプラインの開発の簡素化、GDPR 駆動の更新と削除への準拠、およびデータの挿入とイベントの更新を必要とするセンサーやデバイスからのストリーミングデータの管理に役立つレコードレベルのデータ処理を提供します。0.8.0 リリースでは、データをコピーせずに、大きな Parquet テーブルを Hudi に移行しやすくなり、Athena を介してクエリおよび分析できるようになります。Athena の新しいスナップショットクエリのサポートを使用して、ストリーミングテーブルの更新をほぼリアルタイムで表示できます。

Athena での Hudi の使用の詳細については、「Apache Hudi データセットをクエリする」を参照してください。

2021 年 7 月 8 日

公開日: 2021 年 7 月 8 日

Athena 用の ODBC 1.1.11 ドライバーがリリースされました。ODBC ドライバーが JSON ウェブトークン (JWT) を使用して接続を認証できるようになりました。Linux では、Workgroup プロパティのデフォルト値は Primary に設定されています。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「ODBC で Amazon Athena に接続する」を参照してください。

2021 年 7 月 1 日

公開日: 2021 年 7 月 1 日

2021年7月1日、プレビューワークグループの特別な取り扱いが終了しました。AmazonAthenaPreviewFunctionality ワークグループの名前は保持されますが、特別なステータスはなくなります。引き続き AmazonAthenaPreviewFunctionality ワークグループを使用して、クエリを表示、変更、整理、実行できます。ただし、以前プレビューに含まれていた機能を使用するクエリには、標準の Athena 請求条件が適用されます。請求については、「Amazon Athena の料金」を参照してください。

2021 年 6 月 23 日

公開日: 2021 年 6 月 23 日

Athena 用の JDBC 2.0.23 ドライバー と ODBC 1.1.10 ドライバー がリリースされました。どちらのドライバーも、読み込み性能とサポートが向上し、EXPLAIN ステートメントおよびパラメータ化されたクエリをサポートしています。

EXPLAIN ステートメントは、SQL クエリの論理実行計画または分散実行計画を示します。パラメータ化されたクエリを使用すると、実行時に指定された異なる値を使用して、同じクエリを複数回使用できます。

JDBC リリースでは、アクティブディレクトリフェデレーションサービス 2019 のサポートと、AWS STS 用のカスタムエンドポイント優先オプションが追加されています。ODBC リリースでは、IAM プロファイル認証情報の問題を修正しています。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」および「ODBC で Amazon Athena に接続する」を参照してください。

2021 年 5 月 12 日

公開日: 2021 年 5 月 12 日

Amazon Athena を使用して、所有するアカウント以外のアカウントから AWS Glue を登録できるようになりました。AWS Glue に必要な IAM アクセス許可を設定したら、Athena を使用してクロスアカウントクエリを実行できます。

詳細については、別のアカウントからデータカタログを登録するおよびAWS Glue データカタログへのクロスアカウントアクセスを構成するを参照してください。

2021 年 5 月 10 日

公開日: 2021 年 5 月 10 日

Athena 用の ODBC ドライバーバージョン1.1.9.1001 がリリースされました。このバージョンでは、Azure Active Directory (AD) を使用した際に発生する BrowserAzureAD 認証タイプの問題を修正しています。

新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「ODBC で Amazon Athena に接続する」を参照してください。

2021 年 5 月 5 日

公開日: 2021 年 5 月 5 日

横串検索で Amazon Athena Vertica コネクタを使用して、Athena から Vertica データソースをクエリできるようになりました。例えば、Vertica 上のデータウェアハウス、および Amazon S3 内のデータレイクに対して分析クエリを実行できます。

Athena Vertica コネクタをデプロイするには、AWS Serverless Application Repository の「AthenaVerticaConnector」ページを参照してください。

Amazon Athena Vertica コネクタは、Lambda 環境変数を使用して、いくつかの設定オプションを公開します。設定オプション、パラメータ、接続文字列、デプロイ、および制限事項については、「Amazon Athena Vertica コネクタ」を参照してください。

Vertica コネクタの使用に関する詳細については、「AWS ビッグデータブログ」の「Athena 横串検索 SDK を使用して Amazon Athena で Vertica データソースをクエリする」を参照してください。

2021 年 4 月 30 日

公開日: 2021 年 4 月 30 日

Athena 用の JDBC ドライバー 2.0.21 と ODBC ドライバー 1.1.9 がリリースされました。両方のリリースで、Azure Active Directory (AD) での SAML 認証と、PingFederate での SAML 認証がサポートされています。JDBC リリースでは、パラメータ化されたクエリもサポートされています。Athena でのパラメータ化されたクエリの詳細については、「パラメータ化されたクエリを使用する」を参照してください。

新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」および「ODBC で Amazon Athena に接続する」を参照してください。

2021 年 4 月 29 日

公開日: 2021 年 4 月 29 日

Amazon Athena が、中国 (北京) および中国 (寧夏) リージョンでの Athena エンジンバージョン 2 の提供開始を発表しました。

Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。

2021 年 4 月 26 日

公開日: 2021 年 4 月 26 日

Athena エンジンバージョン 2 のウィンドウ値関数が IGNORE NULLSRESPECT NULLS をサポートするようになりました。

詳細については、Presto ドキュメントの「Value Functions」を参照してください。

2021 年 4 月 21 日

公開日: 2021 年 4 月 21 日

Amazon Athena が欧州 (ミラノ) およびアフリカ (ケープタウン) リージョンでの Athena エンジンバージョン 2 の提供開始を発表しました。

Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。

2021 年 4 月 5 日

公開日: 2021 年 4 月 5 日

EXPLAIN ステートメント

Athena で EXPLAIN ステートメントを使用して、SQL クエリの実行プランを表示できるようになりました。

詳細については、Athena での EXPLAIN および EXPLAIN ANALYZE の使用およびAthena EXPLAIN ステートメントの結果を理解するを参照してください。

SQL クエリでの SageMaker 機械学習モデル

Amazon SageMaker を使用した機械学習モデル推論が、Amazon Athena で一般公開されました。SQL クエリで機械学習モデルを使用して、SQL クエリで関数を呼び出すことによる異常検知、カスタマーコーホート分析、および時系列予測などの複合型のタスクを簡素化します。

詳細については、「Amazon Athena で機械学習 (ML) を使用する」を参照してください。

ユーザー定義関数 (UDF)

ユーザー定義関数 (UDF) が Athena で一般公開されました。UDF を使用して、単一の SQL クエリでレコードまたはレコードのグループを処理するカスタム関数を活用します。

詳細については、「ユーザー定義関数を使用してクエリする」を参照してください。

2021 年 3 月 30 日

公開日: 2021 年 3 月 30 日

Amazon Athena が、アジアパシフィック (香港) および中東 (バーレーン) リージョンでの Athena エンジンバージョン 2 の提供開始を発表しました。

Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。

2021 年 3 月 25 日

公開日: 2021 年 3 月 25 日

Amazon Athena が、ヨーロッパ (ストックホルム) リージョンでの Athena エンジンバージョン 2 の提供開始を発表しました。

Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。

2021 年 3 月 5 日

公開日: 2021 年 3 月 5 日

Amazon Athena が、カナダ (中部)、欧州 (フランクフルト)、および南米 (サンパウロ) の各リージョンでの Athena エンジンバージョン 2 の提供開始を発表しました。

Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。

2021 年 2 月 25 日

公開日: 2021 年 2 月 25 日

Amazon Athena が、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、欧州 (ロンドン)、および欧州 (パリ) の各リージョンでの Athena エンジンバージョン 2 の一般提供開始を発表しました。

Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。

Athena リリースノート (2020 年)

2020 年 12 月 16 日

公開日: 2020 年 12 月 16 日

Amazon Athena が、他のリージョンで Athena エンジンバージョン 2、Athena Federated Query、および AWS PrivateLink を提供することを発表しました。

Athena エンジンバージョン 2 と Athena 横串検索

Amazon Athena が、アジアパシフィック (ムンバイ)、アジアパシフィック (東京)、欧州 (アイルランド)、および米国西部 (北カリフォルニア) の各リージョンでの Athena エンジンバージョン 2 および Athena 横串検索の一般提供開始を発表しました。Athena エンジンバージョン 2 と横串検索は、すでに米国東部 (バージニア北部)、米国東部 (オハイオ)、および米国西部 (オレゴン) の各リージョンで利用可能です。

詳細については、Athena エンジンバージョン 2およびAmazon Athena 横串検索を使用するを参照してください。

欧州 (ストックホルム) リージョンで Athena の AWS PrivateLink がサポートされるようになりました。Athena の AWS PrivateLink については、「インターフェイス VPC エンドポイントを使用して Amazon Athena に接続する」を参照してください。

2020 年 11 月 24 日

公開日: 2020 年 11 月 24 日

Athena 用の JDBC ドライバー 2.0.16 と ODBC ドライバー 1.1.6 がリリースされました。これらのリリースでは、Okta Verify 多要素認証 (MFA) をアカウントレベルでサポートします。また、Okta MFA を使用して SMS 認証と Google 認証システムの認証を要素として設定することもできます。

新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」および「ODBC で Amazon Athena に接続する」を参照してください。

2020 年 11 月 11 日

公開日: 2020 年 11 月 11 日

Amazon Athena が、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国東部 (オハイオ)、および米国西部 (オレゴン) の各リージョンでの Athena エンジンバージョン 2 および横串検索の一般提供開始を発表しました。

Athena エンジンバージョン 2

Amazon Athena が、新しいクエリエンジンバージョンである Athena エンジンバージョン 2 の米国東部 (バージニア北部)、米国東部 (オハイオ)、および米国西部 (オレゴン) の各リージョンでの一般提供開始を発表しました。

Athena エンジンバージョン 2 には、Parquet 形式のデータに対するスキーマ進化のサポート、追加の地理空間関数、ネストされたスキーマの読み込みによるコスト削減のサポート、および JOIN と AGGATE オペレーションにおけるパフォーマンス強化などのパフォーマンス面での改善と新しい機能が含まれています。

フェデレーティッド SQL クエリ

米国東部 (バージニア北部)、米国東部 (オハイオ)、および米国西部 (オレゴン) の各リージョンで、AmazonAthenaPreviewFunctionality ワークグループを使用することなく Athena のフェデレーティッドクエリを利用できるようになりました。

フェデレーティッド SQL クエリを使用して、リレーショナル、非リレーショナル、オブジェクト、カスタムの各データソース間で SQL クエリを実行します。横串検索を使用すると、ユーザーは単一の SQL クエリを送信することで、オンプレミスで実行されているか、クラウド内でホストされている複数のソースのデータをスキャンできます。

複数のアプリケーションに分散されたデータに対する分析の実行は、以下の理由により、複合型で時間がかかる場合があります。

  • 分析に必要なデータは、通常、リレーショナル、キーバリュー、ドキュメント、インメモリ、検索、グラフ、オブジェクト、時系列、および台帳の各データストアに分散されています。

  • これらのソース間のデータを分析するために、分析では複合型のパイプラインを構築してデータを抽出、変換し、データウェアハウスにロードすることで、データにクエリを実行できるようにします。

  • さまざまなソースのデータにアクセスするには、新しいプログラミング言語とデータアクセスコンストラクトを学習する必要があります。

Athena のフェデレーティッド SQL クエリは、データの保管場所にかかわらず、ユーザーがインプレースでデータをクエリできるようにすることで、このような複合型を排除します。アナリストは、使い慣れた SQL コンストラクトを使用して複数のデータソース間でデータを JOIN してすばやく分析し、後で使用できるようにその結果を Simple Storage Service (Amazon S3) に保存できます。

データソースコネクタ

横串検索を処理するために、Athena は AWS Lambda で実行される Athena データソースコネクタを使用します。以下の事前構築されたオープンソースコネクタは、Athena によって記述され、テストされたものです。これらを使用して、対応するデータソースに対する SQL クエリを Athena で実行します。

カスタムデータソースコネクタ

Athena Query Federation SDK を使用することによって、デベロッパーは任意のデータソースへのコネクタを構築して、Athena がそのデータソースに対して SQL クエリを実行できるようにすることが可能です。Athena Query Federation コネクタは、AWS が提供するコネクタよりも幅広いフェデレーティッドクエリの利点を提供します。コネクタは AWS Lambda で実行されるため、インフラストラクチャを管理したり、ピーク需要に合わせてスケーリングを計画したりする必要はありません。

次のステップ

2020 年 10 月 22 日

公開日: 2020 年 10 月 22 日

これで AWS Step Functions で Athena を呼び出せます。AWS Step Functions は、Amazon States Language を直接使用して特定の AWS のサービス を制御できます。Step Functions を Athena で使用して、クエリの実行の開始と停止、クエリ結果の取得、アドホックまたはスケジュールされたデータクエリの実行、Simple Storage Service (Amazon S3) 内のデータレイクからの結果の取得を行うことができます。

詳細については、「AWS Step Functions デベロッパーガイド」の「Step Functions で Athena を呼び出す」を参照してください。

2020 年 7 月 29 日

公開日: 2020 年 7 月 29 日

JDBC ドライバーバージョン 2.0.13 がリリースされました。このリリースは、Athena に登録された複数のデータカタログ、認証のための Okta サービス、および VPC エンドポイントへの接続の使用をサポートします。

新しいバージョンのドライバーをダウンロードして使用するには、「JDBC で Amazon Athena に接続する」を参照してください。

2020 年 7 月 9 日

公開日: 2020 年 7 月 9 日

Amazon Athena が、圧縮された Hudi データセットのクエリに対するサポートと、Athena に登録するデータカタログを作成、更新、または削除するための AWS CloudFormation の AWS::Athena::DataCatalog リソースを追加しました。

Apache Hudi データセットのクエリ

Apache Hudi は、増分データ処理を簡素化するオープンソースのデータ管理フレームワークです。Amazon Athena が、Amazon S3 ベースのデータレイク内にある Apache Hudi データセットの読み込み最適化ビューのクエリをサポートするようになりました。

詳細については、「Apache Hudi データセットをクエリする」を参照してください。

AWS CloudFormation データカタログのリソース

Amazon Athena の横串検索機能を使用してデータソースをクエリするには、まずデータカタログを Athena に登録する必要があります。AWS CloudFormation の AWS::Athena::DataCatalog リソースを使用して、Athena に登録するデータカタログを作成、更新、または削除できるようになりました。

詳細については、「AWS CloudFormation ユーザーガイド」の「AWS::Athena::DataCatalog」を参照してください。

2020 年 6 月 1 日

公開日: 2020 年 6 月 1 日

Amazon Athena での Apache Hive メタストアのメタカタログとしての使用

Athena での AWS Glue Data Catalog に加えて、Athena を 1 つ以上の Apache Hive メタストアに接続できるようになりました。

自己ホスト型の Hive メタストアに接続するには、Athena Hive メタストアコネクタが必要です。Athena は、これに使用できるリファレンス実装コネクタを提供します。コネクタは、ユーザーのアカウントで AWS Lambda 関数として動作します。

詳細については、「外部の Hive メタストアを使用する」を参照してください。

2020 年 5 月 21 日

公開日: 2020 年 5 月 21 日

Amazon Athena がパーティション射影のサポートを追加しました。パーティション射影を使用して、高度にパーティションされたテーブルのクエリ処理を高速化し、パーティション管理を自動化します。詳細については、「Amazon Athena でパーティション射影を使用する」を参照してください。

2020 年 4 月 1 日

公開日: 2020 年 4 月 1 日

米国東部 (バージニア北部) リージョンに加えて、アジアパシフィック (ムンバイ)、欧州 (アイルランド)、および米国西部 (オレゴン) の各リージョンでも Amazon Athena のフェデレーティッドクエリユーザー定義関数 (UDF)機械学習推論、および外部 Hive メタストア機能をプレビューできるようになりました。

2020 年 3 月 11 日

公開日: 2020 年 3 月 11 日

Amazon Athena が、クエリの状態推移に関する Amazon EventBridge イベントをパブリッシュするようになりました。クエリの状態が推移 (例えば、「成功」または「キャンセル済」など、「実行中」から最終状態に推移) すると、Athena はクエリ状態変更イベントを EventBridge にパブリッシュします。イベントには、クエリ状態移行に関する情報が含まれます。詳細については、「EventBridge を使用して Athena クエリ イベントをモニタリングする」を参照してください。

2020 年 3 月 6 日

公開日: 2020 年 3 月 6 日

AWS CloudFormation の AWS::Athena::WorkGroup リソースを使用して、Amazon Athena ワークグループを作成し、更新できるようになりました。詳細については、「AWS CloudFormation ユーザーガイド」の「AWS::Athena::WorkGroup」を参照してください。

Athena リリースノート (2019 年)

2019 年 11 月 26 日

公開日: 2019 年 12 月 17 日

Amazon Athena が、リレーショナル、非リレーショナル、オブジェクト、およびカスタムの各データソース間における SQL クエリの実行、SQL クエリにおける機械学習モデルの呼び出し、ユーザー定義関数 (UDF) (プレビュー)、メタデータカタログとしての Apache Hive メタストアの Amazon Athena での使用 (プレビュー)、および 4 つの追加のクエリ関連メトリクスに対するサポートを追加しました。

フェデレーティッド SQL クエリ

フェデレーティッド SQL クエリを使用して、リレーショナル、非リレーショナル、オブジェクト、カスタムの各データソース間で SQL クエリを実行します。

Athena のフェデレーティッドクエリを使用して、リレーショナル、非リレーショナル、オブジェクト、およびカスタムの各データソースに保存されているデータをスキャンできるようになりました。横串検索を使用すると、ユーザーは単一の SQL クエリを送信することで、オンプレミスで実行されているか、クラウド内でホストされている複数のソースのデータをスキャンできます。

複数のアプリケーションに分散されたデータに対する分析の実行は、以下の理由により、複合型で時間がかかる場合があります。

  • 分析に必要なデータは、通常、リレーショナル、キーバリュー、ドキュメント、インメモリ、検索、グラフ、オブジェクト、時系列、および台帳の各データストアに分散されています。

  • これらのソース間のデータを分析するために、分析では複合型のパイプラインを構築してデータを抽出、変換し、データウェアハウスにロードすることで、データにクエリを実行できるようにします。

  • さまざまなソースのデータにアクセスするには、新しいプログラミング言語とデータアクセスコンストラクトを学習する必要があります。

Athena のフェデレーティッド SQL クエリは、データの保管場所にかかわらず、ユーザーがインプレースでデータをクエリできるようにすることで、このような複合型を排除します。アナリストは、使い慣れた SQL コンストラクトを使用して複数のデータソース間でデータを JOIN してすばやく分析し、後で使用できるようにその結果を Simple Storage Service (Amazon S3) に保存できます。

データソースコネクタ

Athena は、AWS Lambda で実行される Athena データソースコネクタを使用して横串検索を処理します。これらのオープンソースのデータソース コネクタを使用して、Amazon DynamoDBApache HBaseAmazon Document DBAmazon CloudWatchAmazon CloudWatch Metrics、および JDBC 準拠のリレーショナルデータベース (MySQL や Apache 2.0 ライセンスに基づく PostgreSQL など) 間でのフェデレーティッド SQL クエリを Athena で実行します。

カスタムデータソースコネクタ

Athena Query Federation SDK を使用することによって、デベロッパーは任意のデータソースへのコネクタを構築して、Athena がそのデータソースに対して SQL クエリを実行できるようにすることが可能です。Athena Query Federation コネクタは、AWS が提供するコネクタよりも幅広いフェデレーティッドクエリの利点を提供します。コネクタは AWS Lambda で実行されるため、インフラストラクチャを管理したり、ピーク需要に合わせてスケーリングを計画したりする必要はありません。

プレビューの可用性

Athena 横串検索は、米国東部 (バージニア北部) リージョンでプレビューできます。

次のステップ

SQL クエリでの機械学習モデルの呼び出し

推論用の機械学習モデルを Athena クエリから直接呼び出せるようになりました。SQL クエリで機械学習モデルを使用できる場合、異常検知、カスタマーコーホート分析、売上予測などの複合型のタスクが、SQL クエリで機能を呼び出すのと同じくらいシンプルになります。

ML モデル

Amazon SageMaker が提供する多数の組み込み型機械学習アルゴリズムを使用すると、独自のモデルをトレーニングするか、AWS Marketplace でモデルパッケージを見つけてサブスクライブして、これらのモデルを Amazon SageMaker ホスティングサービスにデプロイできます。追加の設定は不要です。これらの ML モデルは、Athena コンソール、Athena APIs、および Athena のプレビュー JDBC ドライバーから SQL クエリで呼び出せます。

プレビューの可用性

本日から米国東部 (バージニア北部) リージョンで Athena の ML 機能をプレビューできます。

次のステップ

ユーザー定義関数 (UDF) (プレビュー)

カスタムスカラー関数を記述して、それらを Athena クエリで呼び出せるようになりました。UDF は、Athena Query Federation SDK を使用して Java で記述できます。Athena に送信された SQL クエリで UDF が使用されていると、この UDF は AWS Lambda で呼び出され、実行されます。UDF は、SQL クエリの SELECT 句と FILTER 句の両方で使用できます。複数の UDF を同じクエリで呼び出せます。

プレビューの可用性

Athena の UDF 機能は、米国東部 (バージニア北部) リージョンでプレビューモードで使用できます。

次のステップ

Amazon Athena での Apache Hive メタストアのメタカタログとしての使用 (プレビュー)

Athena での AWS Glue Data Catalog に加えて、Athena を 1 つ以上の Apache Hive メタストアに接続できるようになりました。

メタストアコネクタ

自己ホスト型の Hive メタストアに接続するには、Athena Hive メタストアコネクタが必要です。Athena は、これに使用できるリファレンス実装コネクタを提供します。コネクタは、ユーザーのアカウントで AWS Lambda 関数として動作します。詳細については、「外部 Hive メタストアの Athena データコネクターの使用 (プレビュー)」を参照してください。

プレビューの可用性

Hive メタストア機能は、米国東部 (バージニア北部) リージョンでプレビューモードで使用できます。

次のステップ

新しいクエリ関連メトリクス

Athena が、Amazon Athena のパフォーマンスを理解するうえで役立つ、追加のクエリメトリクスをパブリッシュするようになりました。Athena は、クエリ関連のメトリクスを Amazon CloudWatch にパブリッシュします。このリリースでは、Athena が以下の追加のクエリメトリクスをパブリッシュします。

  • Query Planning Time – クエリを計画するためにかかった時間。これには、データソースからテーブルパーティションを取得するためにかかった時間も含まれます。

  • Query Queuing Time – クエリがキュー内でリソースを待機していた時間。

  • Service Processing Time – クエリエンジンが処理を完了してから結果が書き込まれるまでにかかった時間。

  • Total Execution Time – Athena がクエリを実行するために費やした時間。

これらの新しいクエリメトリクスを使用するには、カスタムダッシュボードを作成する、CloudWatch のメトリクスにアラームとトリガーを設定する、または Athena コンソールから事前入力済みのダッシュボードを直接使用できます。

次のステップ

詳細については、「CloudWatch メトリクスを使用した Athena クエリのモニタリング」を参照してください。

2019 年 11 月 12 日

公開日: 2019 年 12 月 17 日

Amazon Athena が、中東 (バーレーン) リージョンで利用可能になりました。

2019 年 11 月 8 日

公開日: 2019 年 12 月 17 日

Amazon Athena が米国西部 (北カリフォルニア) リージョンと欧州 (パリ) リージョンで利用可能になりました。

2019 年 10 月 8 日

公開日: 2019 年 12 月 17 日

Amazon Athena が、Virtual Private Cloud (VPC) のインターフェイス VPC エンドポイント経由での Athena への直接接続を許可するようになりました。この機能を使用することで、VPC にインターネットゲートウェイを設定する必要なく、安全にクエリを Athena に送信できます。

Athena に接続するためのインターフェイス VPC エンドポイントを作成するには、AWS Management Console または AWS Command Line Interface (AWS CLI) を使用します。インターフェイスエンドポイントの作成については、「インターフェイスエンドポイントの作成」を参照してください。

インターフェイス VPC エンドポイントを使用すると、VPC と Athena API 間の通信がセキュア化され、AWS ネットワーク内にとどまります。この機能を使用するために、追加の Athena 料金は発生しません。インターフェイス VPC エンドポイントの料金が適用されます。

この機能の詳細については、「インターフェイス VPC エンドポイントを使用して Amazon Athena Connect する」を参照してください。

2019 年 9 月 19 日

公開日: 2019 年 12 月 17 日

Amazon Athena では、INSERT INTO ステートメントを使用して既存のテーブルに新しいデータを挿入できるようになりました。ソーステーブルで実行される SELECT クエリステートメント、またはクエリステートメントの一部として提供される値のセットに基づいて、ターゲットテーブルに新しい行を挿入できます。データ形式として Avro、JSON、ORC、Parquet、テキストファイルなどがサポートされています。

INSERT INTO ステートメントを使用して ETL プロセスを簡素化することもできます。たとえば、単一のクエリで INSERT INTO を使用することで、JSON 形式のソーステーブルからデータを選択して Parquet 形式のターゲットテーブルに書き込めます。

INSERT INTO ステートメントは、Athena での SELECT クエリの場合と同様に、SELECT フェーズでスキャンしたバイト数に基づいて課金されます。詳細については、「Amazon Athena の料金」を参照してください。

サポートされている形式、SerDes、および例などの INSERT INTO の使用に関する詳細については、Athena ユーザーガイドの「INSERT INTO」を参照してください。

2019 年 9 月 12 日

公開日: 2019 年 12 月 17 日

Amazon Athena が、アジアパシフィック (香港) リージョンで利用可能になりました。

2019 年 8 月 16 日

公開日: 2019 年 12 月 17 日

Amazon Athena が、Amazon S3 リクエスタ支払いバケット内のデータに対するクエリのサポートを追加しました。

Amazon S3 バケットがリクエスタ支払いとして設定されている場合、Amazon S3 リクエストとデータ転送のコストは、バケット所有者ではなくリクエスタが支払います。Athena では、ワークグループ管理者が、ワークグループメンバーによる S3 リクエスタ支払いバケットへのクエリを許可するようにワークグループを設定できるようになりました。

ワークグループのリクエスタ支払い設定を行う方法については、Amazon Athena ユーザーガイドの「ワークグループの作成」を参照してください。リクエスタ支払いバケットの詳細については、「Amazon Simple Storage Service デベロッパーガイド」の「リクエスタ支払いバケット」を参照してください。

2019 年 8 月 9 日

公開日: 2019 年 12 月 17 日

Amazon Athena が、Simple Storage Service (Amazon S3) に保存されたデータ用の AWS Lake Formation で定義された、新しい、または既存のデータベース、テーブル、および列に対するきめ細かなアクセスコントロールのための AWS Glue Data Catalog ポリシーの実施をサポートするようになりました。

この機能は、米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (オレゴン)、アジアパシフィック (東京)、および欧州 (アイルランド) の各 AWS リージョン で利用できます。この機能の使用に追加料金は発生しません。

この機能の使用方法については、「Athena を使用して AWS Lake Formation に登録されたデータをクエリする」を参照してください。の詳細については、「AWS Lake Formation」を参照してください。AWS Lake Formation

2019 年 6 月 26 日

Amazon Athena が欧州 (ストックホルム) リージョンで利用可能になりました。サポートされているリージョンのリストについては、「AWS リージョン およびエンドポイント」を参照してください。

2019 年 5 月 24 日

公開日: 2019 年 05 月 24 日

Amazon Athena が AWS GovCloud (米国東部) および AWS GovCloud (米国西部) の各リージョンで利用可能になりました。サポートされているリージョンのリストについては、AWS リージョン およびエンドポイントを参照してください。

2019 年 3 月 5 日

公開日: 2019 年 03 月 05 日

Amazon Athena がカナダ (中部) リージョンで利用可能になりました。サポートされているリージョンのリストについては、AWS リージョン およびエンドポイントを参照してください。Athena ワークグループをサポートする新しいバージョンの ODBC ドライバーがリリースされました。詳細については、「ODBC ドライバーリリースノート」を参照してください。

ODBC ドライバーのバージョン 1.0.5 とそのドキュメントをダウンロードするには、「ODBC で Amazon Athena に接続する」を参照してください。このバージョンの詳細については、「ODBC ドライバーリリースノート」を参照してください。

ODBC ドライバーでワークグループを使用するには、次の例に示すように、接続文字列に新しい接続プロパティ Workgroup を設定します。

Driver=Simba Athena ODBC Driver;AwsRegion=[Region];S3OutputLocation=[S3Path];AuthenticationType=IAM Credentials;UID=[YourAccessKey];PWD=[YourSecretKey];Workgroup=[WorkgroupName]

詳細については、「ODBC ドライバーのインストールおよび設定ガイドバージョン 1.0.5」で「workgroup」を検索してください。ワークグループでタグを使用しても、ODBC ドライバーの接続文字列は変更されません。タグを使用するには、最新バージョンの ODBC ドライバー (この最新バージョン) にアップグレードしてください。

このドライバーバージョンでは、Athena API ワークグループアクションを使用してワークグループを作成および管理し、Athena API タグアクションを使用してワークグループのタグを追加、リスト化、または削除できます。使用を開始する前に、ワークグループとタグに対するアクションに関するリソースレベルの IAM 許可があることを確認してください。

詳細については、以下を参照してください。

JDBC ドライバー、または AWS SDK を使用している場合は、最新バージョンのドライバーと SDK にアップグレードしてください。どちらにも、Athena のワークグループとタグのサポートが既に含まれています。詳細については、「JDBC で Amazon Athena に接続する」を参照してください。

2019 年 2 月 22 日

公開日: 2019 年 02 月 22 日

Amazon Athena のワークグループにタグのサポートを追加しました。タグは、1 つのキーと 1 つの値で構成されており、どちらもお客様側が定義します。ワークグループにタグを付けるときは、カスタムメタデータを割り当てます。AWS タグ付けのベストプラクティスを使用して、ワークグループにタグを追加してそれらを分類できます。タグを使用してワークグループへのアクセスを制限し、コストを追跡できます。たとえば、コストセンターごとにワークグループを作成します。その後、これらのワークグループにタグを追加することで、各コストセンターの Athena 支出を追跡できます。詳細については、「AWS Billing and Cost Management ユーザーガイド」の「請求へのタグの使用」を参照してください。

タグは、Athena コンソール、または API オペレーションを使用することで操作できます。詳細については、「Athena リソースにタグ付けする」を参照してください。

Athena コンソールでは、各ワークグループに 1 つ、または複数のタグを追加して、それらをタグで検索できます。ワークグループは、Athena にある IAM で管理されるリソースです。IAM では、作成したワークグループのタグを追加、削除、またはリスト化できるユーザーを制限できます。ワークグループに 1 つ以上のタグを追加するためのオプションのタグパラメータを持つ CreateWorkGroup API オペレーションを使用することもできます。タグを追加、削除、または一覧表示するには、TagResourceUntagResource、および ListTagsForResource を使用します。詳細については、「API および AWS CLI タグオペレーションを使用する」を参照してください。

ワークグループの作成時にユーザーがタグを追加できるようにするには、各ユーザーに TagResourceCreateWorkGroup の API アクションの両方に対する IAM 許可を付与するようにしてください。詳細な説明と例については、「タグベースの IAM アクセスコントロールポリシーを使用する」を参照してください。

ワークグループでタグを使用しても、JDBC ドライバーは変更されません。新しいワークグループを作成して JDBC ドライバーまたは AWS SDK を使用する場合は、最新バージョンのドライバーと SDK に更新してください。詳細については、JDBC で Amazon Athena に接続する を参照してください。

2019 年 2 月 18 日

公開日: 2019 年 02 月 18 日

ワークグループでクエリを実行することによってクエリコストを制御する機能が追加されました。詳細については、ワークグループを使用してクエリのアクセスとコストを制御する を参照してください。Athena で使用される JSON OpenX SerDe を改善し、Athena が GLACIER ストレージクラスに移行されたオブジェクトを無視しないという問題を修正しました。また、Network Load Balancer ログをクエリする例を追加しました。

以下の変更を加えました。

  • ワークグループ用のサポートを追加しました。ワークグループを使用して、ユーザー、チーム、アプリケーション、またはワークロードを分離し、各クエリまたはワークグループ全体で処理できるデータ量に制限を設定します。ワークグループは IAM リソースとして機能するため、リソースレベルのアクセス許可を使用して特定のワークグループへのアクセスを制御できます。Amazon CloudWatch でクエリ関連のメトリクスを表示する、スキャンされるデータの量に制限を設定することによってクエリコストを管理する、しきい値を作成する、およびこれらのしきい値を超えたときに Amazon SNS アラームなどのアクションをトリガーすることもできます。詳細については、ワークグループを使用してクエリのアクセスとコストを制御するおよびCloudWatch と EventBridge を使用してクエリをモニタリングし、コストを管理するを参照してください。

    ワークグループは、IAM リソースです。IAM のワークグループ関連のアクション、リソース、および条件の完全なリストについては、「Service Authorization Reference」の「Actions, Resources, and Condition Keys for Amazon Athena」を参照してください。新しいワークグループを作成する前に、ワークグループの IAM ポリシーAWS 管理ポリシー: AmazonAthenaFullAccess を使用するようにしてください。

    ワークグループ API オペレーション、または JDBC ドライバーを使用して、コンソールでワークグループを使用できます。ワークグループ作成の詳細については、「ワークグループの作成」を参照してください。ワークグループサポート付きの JDBC ドライバーをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。

    JDBC ドライバーでワークグループを使用する場合は、次の例のように Workgroup 設定パラメータを使用して接続文字列にワークグループ名を設定する必要があります。

    jdbc:awsathena://AwsRegion=<AWSREGION>;UID=<ACCESSKEY>; PWD=<SECRETKEY>;S3OutputLocation=s3://amzn-s3-demo-bucket/<athena-output>-<AWSREGION>/; Workgroup=<WORKGROUPNAME>;

    SQL ステートメントの実行方法やドライバーへの JDBC API 呼び出しの方法に変更はありません。ドライバーがワークグループ名を Athena に渡します。

    ワークグループに導入された変更点については、「Athena ワークグループ API を使用する」および「ワークグループエラーのトラブルシューティング」を参照してください。

  • Athena で使用される JSON OpenX SerDe を改善しました。改善点は次のとおりです。

    • ConvertDotsInJsonKeysToUnderscores プロパティをサポートします。TRUE に設定すると、SerDe はキー名のドットをアンダースコアに置き換えることができます。たとえば、JSON データセットに "a.b" という名前のキーが含まれている場合は、このプロパティを使用して、Athena で列名が "a_b" になるように定義できます。デフォルト: FALSE。デフォルトで、Athena は列名にドットを許可しません。

    • case.insensitive プロパティをサポートします。デフォルトで、Athena では JSON データセットのすべてのキーに小文字が使用される必要があります。WITH SERDE PROPERTIES ("case.insensitive"= FALSE;) を使用すると、データ内で大文字と小文字を区別してキー名を使用できます。デフォルト: TRUETRUE に設定すると、SerDe はすべての大文字の列を小文字に変換します。

    詳細については、「OpenX JSON SerDe」を参照してください。

  • Simple Storage Service (Amazon S3) ライフサイクルポリシーによって Glacier にアーカイブされた Amazon S3 オブジェクトを処理したときに、Athena が "access denied" エラーメッセージを返す問題を修正しました。この問題を解決した結果、Athena が GLACIER ストレージクラスに移行したオブジェクトを無視するようになりました。Athena では、GLACIER ストレージクラスからのデータのクエリがサポートされていません。

    詳細については、「Amazon S3 に関する考慮事項」および「Amazon Simple Storage Service ユーザーガイド」の「Transitioning to the GLACIER Storage Class (Object Archival)」(GLACIER ストレージクラスへの移行 (オブジェクトのアーカイブ)) を参照してください。

  • Transport Layer Security (TLS) リクエストに関する情報を受け取る Network Load Balancer アクセスログのクエリ例を追加しました。詳細については、「Network Load Balancer のログをクエリする」を参照してください。

Athena リリースノート (2018 年)

2018 年 11 月 20 日

公開日: 2018 年 11 月 20 日

AD FS および SAML 2.0 (Security Assertion Markup Language 2.0) を使用した Athena API へのフェデレーションアクセスをサポートする新しいバージョンの JDBC および ODBC ドライバーをリリースしました。詳細については、「JDBC ドライバーリリースノート」および「ODBC ドライバーリリースノート」を参照してください。

このリリースによって、Athena へのフェデレーションアクセスが Active Directory Federation Service (AD FS 3.0) 対応になります。アクセスは、SAML 2.0 をサポートするバージョンの JDBC や ODBC ドライバーを通じて確立されます。Athena API へのフェデレーションアクセスの設定に関する詳細については、「Athena API へのフェデレーションアクセスを有効にする」を参照してください。

JDBC ドライバーのバージョン 2.0.6 とそのドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。このバージョンの詳細については、「JDBC ドライバーリリースノート」を参照してください。

ODBC ドライバーのバージョン 1.0.4 とそのドキュメントをダウンロードするには、「ODBC で Amazon Athena に接続する」を参照してください。このバージョンの詳細については、「ODBC ドライバーリリースノート」を参照してください。

AWS での SAML 2.0 のサポートに関する詳細については、「IAM ユーザーガイド」の「SAML 2.0 ベースのフェデレーションについて」を参照してください。

2018 年 10 月 15 日

公開日: 2018 年 10 月 15 日

AWS Glue Data Catalog にアップグレードしている場合は、以下のサポートを提供する 2 つの新機能があります。

  • データカタログメタデータの暗号化。データカタログでメタデータを暗号化することを選択する場合は、Athena に特定のポリシーを追加する必要があります。詳細については、「AWS Glue Data Catalog の暗号化されたメタデータへのアクセス」を参照してください。

  • AWS Glue Data Catalog のリソースへのアクセスに対するきめ細かなアクセス許可。Athena で使用されるデータカタログからの特定のデータベースとテーブルへのアクセスを制限または許可する、アイデンティティベースの (IAM) ポリシーを定義できるようになりました。詳細については、「AWS Glue Data Catalog のデータベースとテーブルへのアクセスを構成する」を参照してください。

    注記

    データは Amazon S3 バケットに格納されており、それらに対するアクセスは Athena から Amazon S3 へのアクセスを制御する によって制御されます。データベースとテーブル内のデータにアクセスするには、データを保存する Amazon S3 バケットへのアクセスコントロールポリシーを引き続き使用します。

2018 年 10 月 10 日

公開日: 2018 年 10 月 10 日

Athena では、SELECT クエリステートメントの結果からテーブルを作成する CREATE TABLE AS SELECT がサポートされています。詳細については、「クエリ結果からのテーブルの作成 (CTAS)」を参照してください。

CTAS クエリを作成する前に、Athena ドキュメントでそれらの動作について学習しておくことが重要です。ドキュメントには、クエリ結果を保存するための Amazon S3 の場所、CTAS クエリ結果を保存するためにサポートされている形式のリスト、作成できるパーティションの数、およびサポートされている圧縮形式に関する情報が記載されています。詳細については、「CTAS クエリに関する考慮事項と制約事項」を参照してください。

以下の目的で CTAS クエリを使用します。

2018 年 9 月 6 日

公開日: 2018 年 09 月 06 日

ODBC ドライバーの新しいバージョン (バージョン 1.0.3) がリリースされました。新しいバージョンの ODBC ドライバーは、ページングではなく、デフォルトで結果をストリーミングします。これによりビジネスインテリジェンスツールで大規模なデータセットを迅速に取得できます。このバージョンには改善点、バグ修正、および更新された「プロキシサーバーで SSL を使用する」ドキュメントが含まれています。詳細については、ドライバーの「リリースノート」を参照してください。

ODBC ドライバーのバージョン 1.0.3 とそのドキュメントのダウンロードについては、「ODBC で Amazon Athena に接続する」を参照してください。

結果のストリーミング機能は、新しいバージョンの ODBC ドライバーでのみ使用できます。JDBC ドライバーでも使用できます。結果のストリーミングの詳細については、「ODBC ドライバーのインストールおよび設定ガイド」で「UseResultsetStreaming」を検索してください。

ODBC ドライバーのバージョン 1.0.3 は、以前のバージョンのドライバーのドロップインリプレースです。最新のドライバーに移行することをお勧めします。

重要

ODBC ドライバーバージョン 1.0.3 を使用するには、次の要件に従ってください。

  • アウトバウンドトラフィックに対してポート 444 を開いたままにする。

  • ​Athena のポリシーのリストに ​athena:GetQueryResultsStream ポリシーアクションを追加する。このポリシーアクションは、API で直接公開されていません。結果のストリーミングサポートの一部として ODBC ドライバーおよび JDBC ドライバーとともに使用するだけです。ポリシーの例については、「AWS 管理ポリシー: AWSQuicksightAthenaAccess」を参照してください。

2018 年 8 月 23 日

公開日: 2018 年 08 月 23 日

次に示すとおり DDL に関連する機能のサポートが追加され、バグがいくつか修正されました。

  • Parquet のデータの BINARYDATE データ型、Avro のデータの DATETIMESTAMP データ型のサポートが追加されました。

  • DDL クエリの INTDOUBLE のサポートが追加されました。INTEGERINT のエイリアス、DOUBLE PRECISIONDOUBLE のエイリアスです。

  • DROP TABLEDROP DATABASE のクエリのパフォーマンスが改善されました。

  • データバケットが空になっているときに Simple Storage Service (Amazon S3) で _$folder$ オブジェクトが作成されなくなりました。

  • パーティション値が指定されなかった場合、ALTER TABLE ADD PARTITION がエラーをスローする問題を修正しました。

  • ステートメントに修飾名が指定された後に、パーティションをチェックするときに、DROP TABLE がデータベース名を無視する問題を修正しました。

Athena でサポートされているデータ型の詳細については、「Amazon Athena のデータ型」を参照してください。

Athena、JDBC ドライバー、および Java のデータ型間でサポートされているデータ型マッピングについては、「ODBC Driver Installation and Configuration Guide」の「Data Types」セクションを参照してください。

2018 年 8 月 16 日

公開日: 2018 年 08 月 16 日

JDBC ドライバーのバージョン 2.0.5 がリリースされました。新しいバージョンの JDBC ドライバーは、ページングではなく、デフォルトで結果をストリーミングします。これによりビジネスインテリジェンスツールで大規模なデータセットを迅速に取得できます。JDBC ドライバーの以前のバージョンと比較して、次のパフォーマンスが向上しています。

  • 10,000 行未満を取得するときに、パフォーマンスが約 2 倍向上します。

  • 10,000 行以上を取得するときに、パフォーマンスが 5 ~ 6 倍向上します。

結果のストリーミング機能は、JDBC ドライバーでのみ使用できます。ODBC ドライバーでは使用できません。これを Athena API で使用することはできません。結果のストリーミングの詳細については、「JDBC ドライバーのインストールおよび設定ガイド」で「UseResultsetStreaming」を検索してください。

JDBC ドライバーのバージョン 2.0.5 とそのドキュメントのダウンロードについては、「JDBC で Amazon Athena に接続する」を参照してください。

JDBC ドライバーのバージョン 2.0.5 は、以前のバージョンのドライバー (2.0.2) のドロップインリプレースです。JDBC ドライバーバージョン 2.0.5 が必ず使用されるようにするには、Athena のポリシーのリストに athena:GetQueryResultsStream ポリシーアクションを追加します。このポリシーアクションは、API で直接公開されていません。結果のストリーミングサポートの一部として JDBC ドライバーとともに使用するだけです。ポリシーの例については、「AWS 管理ポリシー: AWSQuicksightAthenaAccess」を参照してください。ドライバーのバージョン 2.0.2 からバージョン 2.0.5 への移行の詳細については、「JDBC ドライバー移行ガイド」を参照してください。

ドライバーをバージョン 1.x から 2.x に移行する場合は、既存の設定を新しい設定に移行する必要があります。最新バージョンのドライバーに移行することを強くお勧めします。詳細については、JDBC Driver Migration Guide」(JDBC ドライバー移行ガイド) を参照してください。

2018 年 8 月 7 日

公開日: 2018 年 08 月 07 日

Amazon Virtual Private Cloud フローログを Amazon S3 に GZIP 形式で直接保存できるようになりました。これらは、Athena でクエリすることができます。詳細については、「Amazon VPC フローログのクエリ」および「Amazon VPC フローログが S3 で使用可能に」を参照してください。

2018 年 5 月 6 日

公開日: 2018 年 06 月 05 日

ビューのサポート

ビューのサポートが追加されました。Athena で CREATE VIEW および CREATE DIALECT VIEWDESCRIBE VIEWDROP VIEWSHOW CREATE VIEW、および SHOW VIEWS が使用できるようになりました。ビューを定義するクエリは、クエリでビューを参照するたびに実行されます。詳細については、「ビューを使用する」を参照してください。

エラーメッセージの改善と更新

  • GSON 2.8.0 ライブラリを CloudTrail SerDe に含めることで、CloudTrail SerDe の問題を解決し、JSON 文字列の改正を有効にしました。

  • 列の順序変更を可能にすることによって、Parquet (場合によっては ORC) に対する Athena でのパーティションスキーマ検証が強化されました。これにより、Athena では徐々に進化するスキーマの変化と AWS Glue クローラから追加されるテーブルに適切に対応できるようになりました。詳細については、「スキーマの更新を処理する」を参照してください。

  • SHOW VIEWS に解析サポートが追加されました。

  • 最も一般的なエラーメッセージに次の改善が加えられました。

    • Athena クエリで SerDe が列の解析に失敗するときの「Internal Error」メッセージを、説明的なエラーメッセージに置き換えました。これまで、Athena は解析エラーの場合に内部エラーを発行していました。新しいエラーメッセージは次のようになります。「HIVE_BAD_DATA: フィールド 0: java.lang のフィールド値の解析エラー。文字列は org.openx.data.jsonserde.json.JSONObject にキャストできません」

    • アクセス許可不足のエラーメッセージが改善されて、詳細が追加されました。

バグ修正

以下のバグを修正しました。

  • REAL から FLOAT データ型への内部変換を有効にする問題が修正されました。これにより、FLOAT データ型を返す AWS Glue クローラの統合が改善されました。

  • Athena が AVRO DECIMAL (論理的な型) を DECIMAL 型に変換しない問題が修正されました。

  • WHERE 句が TIMESTAMP データ型の値を参照している場合に、Parquet データをクエリすると、Athena で 結果が返されないという問題を修正しました。

2018 年 5 月 17 日

公開日: 2018 年 05 月 17 日

Athena でのクエリ同時実行のクォータが 5 件から 20 件に増加されました。これによって、20 件までの DDL クエリおよび 20 件までの SELECT クエリを同時に送信して実行できます。同時実行数のクォータは、DDL および SELECT クエリで別であることに注意してください。

Athena での同時実行クォータは、サービスに対して同時に送信できるクエリの数として定義されます。同じタイプ (DDL あるいは SELECT) のクエリを同時に 20 件まで送信できます。同時実行クエリのクォータを超えるクエリを送信すると、Athena API がエラーメッセージを表示します。

Athena にクエリを送信すると、Athena は、全体的なサービス負荷と着信リクエストの量に基づいてリソースを割り当てることによってクエリを処理します。当社では継続的にサービスをモニタリングして調整を行うため、お客様のクエリはできるだけ短期間で処理されます。

詳細については、Service Quotas を参照してください。これは調整可能なクォータです。Service Quotas コンソールを使用して、同時実行クエリのクォータの引き上げをリクエストできます。

2018 年 4 月 19 日

公開日: 2018 年 04 月 19 日

配列データ型として ResultSet を返すサポート、改良点、およびバグ修正を反映した、新しいバージョンの JDBC ドライバー (バージョン 2.0.2) をリリースしました。詳細については、ドライバーの「リリースノート」を参照してください。

JDBC ドライバーの新しいバージョン 2.0.2 とそのドキュメントのダウンロードについては、「JDBC で Amazon Athena に接続する」を参照してください。

JDBC ドライバーの最新バージョンは 2.0.2 です。ドライバーをバージョン 1.x から 2.x に移行する場合は、既存の設定を新しい設定に移行する必要があります。最新のドライバーに移行することを強くお勧めします。

新しいバージョンのドライバーの変更点、バージョンの相違点、例については、「JDBC ドライバー移行ガイド」を参照してください。

2018 年 4 月 6 日

公開日: 2018 年 04 月 06 日

Athena コンソールでのクエリの入力に自動入力を使用します。

2018 年 3 月 15 日

公開日: 2018 年 03 月 15 日

CloudTrail コンソールから直接 CloudTrail ログファイル用の Athena テーブルを自動作成する機能を追加しました。詳細については、CloudTrail ログ用の Athena テーブルを作成するために CloudTrail コンソールを使用する を参照してください。

2018 年 2 月 2 日

公開日: 2018 年 02 月 12 日

GROUP BY 句を使用するメモリに大きな負担をかけるクエリのディスクに中間データを安全にオフロードする機能が追加されました。これでこのようなクエリの信頼性が向上し、「Query resource exhausted」(クエリリソースの枯渇) エラーを回避します。

2018 年 1 月 19 日

公開日: 2018 年 01 月 19 日

Athena は、オープンソースの分散型クエリエンジンである Presto を使用してクエリを実行します。

Athena には管理するバージョンがありません。Athena の基盤となるエンジンを Presto 0.172 に基づくバージョンに透過的にアップグレードしました。ユーザー操作は必要はありません。

このアップグレードにより、Athena で Presto 0.172 Lambda Expressions を含めた Presto 0.172 Functions and Operators を使用できるようになります。

このリリースの主な更新 (コミュニティ提供の修正を含む) は以下のとおりです。

  • ヘッダーを無視するサポート。Athena がヘッダーを無視できるように、テーブルの定義時に skip.header.line.count プロパティを使用できます。これは、Grok または Regex SerDes ではなく、LazySimpleSerDeOpenCSV SerDe を使用するクエリをサポートします。

  • STRING 関数での CHAR(n) データ型のサポート。CHAR(n) の範囲は [1.255] です。VARCHAR(n) の範囲は [1,65535] です。

  • 相関サブクエリのサポート。

  • Presto Lambda 式および関数のサポート。

  • DECIMAL 型と演算子のパフォーマンスが向上しました。

  • フィルタ処理された集計のサポート (SELECT sum(col_name) FILTER である id > 0 など)。

  • DECIMALTINYINTSMALLINT、および REAL の各データ型のプッシュダウン述語。

  • 限定比較述語のサポート (ALLANY、および SOME)。

  • 追加された関数: arrays_overlap()array_except()levenshtein_distance()codepoint()skewness()kurtosis()、および typeof()

  • タイムゾーン引数を使用する from_unixtime() 関数のバリアントを追加しました。

  • bitwise_and_agg() 集計関数と bitwise_or_agg() 集計関数を追加しました。

  • xxhash64() 関数と to_big_endian_64() 関数を追加しました。

  • JSON パスの添字でバックスラッシュを使用して二重引用符やバックスラッシュをエスケープするためのサポートを json_extract() 関数と json_extract_scalar() 関数に追加しました。これまでバックスラッシュは標準の文字として扱われていたために、これによってバックスラッシュを使用した呼び出しのセマンティクスが変わります。

関数と演算子については、本ガイドの「DML クエリ、関数、および演算子」、および Presto ドキュメントの「関数と演算子」を参照してください。

Athena はすべての Presto 機能をサポートしません。詳細については、「制限」を参照してください。

Athena リリースノート (2017 年)

2017 年 11 月 13 日

公開日: 2017 年 11 月 13 日

Athena を ODBC ドライバーに接続するためのサポートを追加しました。詳細については、ODBC で Amazon Athena に接続する を参照してください。

2017 年 11 月 1 日

公開日: 2017 年 11 月 01 日

地理空間データのクエリのサポートをアジアパシフィック (ソウル)、アジアパシフィック (ムンバイ)、および欧州 (ロンドン) の各リージョンに追加しました。詳細については、「地理空間データをクエリする」と「AWS リージョン とエンドポイント」を参照してください。

2017 年 10 月 19 日

公開日: 2017 年 10 月 19 日

欧州 (フランクフルト) のサポートを追加しました。サポートされているリージョンの一覧は、「AWS リージョン とエンドポイント」を参照してください。

2017 年 10 月 3 日

公開日: 2017 年 10 月 03 日

AWS CloudFormation で名前付き Athena クエリを作成します。詳細については、「ユーザーガイド」の「AWS::Athena::NamedQuery」を参照してください。

2017 年 9 月 25 日

公開日: 2017 年 09 月 25 日

アジアパシフィック (シドニー) リージョンのサポートを追加しました。サポートされているリージョンの一覧は、「AWS リージョン とエンドポイント」を参照してください。

2017 年 8 月 14 日

公開日: 2017 年 08 月 14 日

AWS Glue Data Catalog との統合を追加したほか、Athena で管理されるデータカタログから AWS Glue Data Catalog に更新するための移行ウィザードを追加しました。詳細については、「AWS Glue を使用して Athena を Amazon S3 のデータに接続する」を参照してください。

2017 年 8 月 4 日

公開日: 2017 年 08 月 04 日

Grok SerDe のサポートを追加しました。これにより、ログなどの構造化されていないテキストファイルのレコードのパターンマッチングが容易になります。詳細については、「Grok SerDe」を参照してください。コンソールを使用してクエリ履歴をスクロールするためのキーボードショートカットを追加しました (Windows での CTRL +⇧/⇩、Mac での CMD + ⇧/⇩)。

2017 年 6 月 22 日

公開日: 2017 年 06 月 22 日

アジアパシフィック (東京) およびアジアパシフィック (シンガポール) の各リージョンのサポートを追加しました。サポートされているリージョンの一覧は、「AWS リージョン とエンドポイント」を参照してください。

2017 年 6 月 8 日

公開日: 2017 年 06 月 08 日

欧州 (アイルランド) のサポートを追加しました。詳細については、AWS リージョン およびエンドポイントを参照してください。

2017 年 5 月 19 日

公開日: 2017 年 05 月 19 日

Amazon Athena API および Athena 用の AWS CLI サポートを追加し、JDBC ドライバーをバージョン 1.1.0 に更新しました。また、さまざまな問題を修正しました。

  • Amazon Athena により、Athena のアプリケーションプログラミングが可能になります。詳細については、「Amazon Athena API リファレンス」を参照してください。最新の AWS SDK には、Athena API のサポートが含まれています。ドキュメントとダウンロードのリンクについては、「Amazon Web Services のツール」の「SDK」セクションを参照してください。

  • AWS CLI には、Athena 用の新しいコマンドが含まれています。詳細については、「Amazon Athena API リファレンス」を参照してください。

  • 新しい JDBC ドライバー 1.1.0 が利用可能になりました。最新バージョンでは、新しい Athena API のサポート、最新の特徴、バグ修正が追加されています。ドライバーを https://downloads.athena.us-east-1.amazonaws.com/drivers/AthenaJDBC41-1.1.0.jar からダウンロードしてください。最新の Athena JDBC ドライバーにアップグレードすることをお勧めします。ただし、以前のドライバーバージョンもまだ使用できます。以前のドライバーバージョンでは Athena API をサポートしていません。詳細については、「JDBC で Amazon Athena に接続する」を参照してください。

  • 以前のバージョンの Athena でポリシーステートメント固有であったアクションは廃止されました。JDBC ドライバーバージョン 1.1.0 にアップグレードして、カスタマー管理の IAM ポリシーやインライン IAM ポリシーを JDBC ユーザーにアタッチする場合は、IAM ポリシーを更新する必要があります。一方、以前のバージョンの JDBC ドライバーは Athena API をサポートしていないため、廃止されたアクションは以前のバージョンの JDBC ユーザーにアタッチされているポリシーでのみ指定できます。このため、カスタマー管理の IAM ポリシーやインライン IAM ポリシーを更新する必要はありません。

  • これらのポリシー固有のアクションは、Athena API のリリース前に Athena で使用されていたものです。これらの廃止されたアクションは、バージョン 1.1.0 より前の JDBC ドライバーのポリシーでのみ使用します。JDBC ドライバーをアップグレードする場合は、廃止されたアクションを許可または拒否するポリシーステートメントを、以下に示す適切な API アクションに置き換えてください。置き換えないと、エラーが発生します。

廃止されたポリシー固有のアクション 対応する Athena API アクション
athena:RunQuery
athena:StartQueryExecution
athena:CancelQueryExecution
athena:StopQueryExecution
athena:GetQueryExecutions
athena:ListQueryExecutions

改良点

  • クエリ文字列の長さの上限を 256 KB に増やしました。

バグ修正

  • コンソールでクエリ結果をスクロールしたときに正常に表示されない問題を修正しました。

  • Amazon S3 データファイルの \u0000 文字列のせいでエラーが発生するという問題を修正しました。

  • JDBC ドライバーを通じて行ったクエリキャンセルのリクエストが失敗するという問題を修正しました。

  • 米国東部 (オハイオ) の Simple Storage Service (Amazon S3) データで AWS CloudTrail SerDe が失敗するという問題を修正しました。

  • パーティションされたテーブルで DROP TABLE が失敗するという問題を修正しました。

2017 年 4 月 4 日

公開日: 2017 年 04 月 04 日

Amazon S3 のデータ暗号化のサポートを追加しました。また、暗号化のサポート、改良点、およびバグ修正を反映した JDBC ドライバーのアップデート (バージョン 1.0.1) をリリースしました。

機能

  • 以下の暗号化機能を追加しました。

    • Amazon S3 の暗号化されたデータのクエリのサポート。

    • Athena クエリ結果の暗号化のサポート。

  • 新しいバージョンのドライバーは新しい暗号化機能をサポートし、改良点とバグ修正を追加しました。

  • ALTER TABLE を使用して列を追加、置換、変更する機能を追加しました。詳細については、Hive ドキュメントの「Alter 列」を参照してください。

  • LZO 圧縮データのクエリのサポートを追加しました。

詳細については、「保管中の暗号化」を参照してください。

改良点

  • JDBC のクエリパフォーマンスが向上しました。ページサイズの改善により、100 行ではなく 1,000 行が返されます。

  • JDBC ドライバーインターフェイスを使用してクエリをキャンセルする機能を追加しました。

  • JDBC 接続 URL で JDBC オプションを指定する機能を追加しました。最新の JDBC ドライバーについては、「JDBC で Amazon Athena に接続する」を参照してください。

  • ドライバーでの PROXY 設定を追加しました。この設定は、AWS SDK for Java の ClientConfiguration を使用して行えます。

バグ修正

以下のバグを修正しました。

  • JDBC ドライバーを使用して複数のクエリを実行すると、スロットリングエラーが発生する場合がある。

  • decimal データ型の射影時に JDBC ドライバーが停止する。

  • テーブルでのデータ型の定義に関係なく、JDBC ドライバーはすべてのデータ型を文字列として返す。たとえば、INT データ型として定義されている列を resultSet.GetObject() を使用して選択すると、INT データ型が返されずに STRING データ型が返される。

  • JDBC ドライバーでの認証情報の検証が、クエリの実行時に行われずに接続時に行われる。

  • スキーマを URL と共に指定すると、JDBC ドライバーを介したクエリが失敗する。

2017 年 3 月 24 日

公開日: 2017 年 03 月 24 日

AWS CloudTrail SerDe の追加、パフォーマンスの向上、およびパーティション問題の修正を行いました。

機能

改良点

  • 多数のパーティションをスキャンするときのパフォーマンスを改善しました。

  • MSCK Repair Table オペレーションのパフォーマンスを改善しました。

  • プライマリリージョン以外のリージョンに保存されている Amazon S3 データをクエリする機能を追加しました。標準の Athena 料金に加えて、Amazon S3 の標準のリージョン間データ転送料金が適用されます。

バグ修正

  • パーティションがロードされないときに「テーブルが見つかりません」エラーが発生するバグを修正しました。

  • ALTER TABLE ADD PARTITION IF NOT EXISTS クエリで例外がスローされないようにバグを修正しました。

  • DROP PARTITIONS のバグを修正しました。

2017 年 2 月 20 日

公開日: 2017 年 02 月 20 日

AvroSerDe と OpenCSVSerDe、米国東部 (オハイオ) リージョン、およびコンソールウィザードでの列の一括編集のサポートを追加しました。大規模な Parquet テーブルのパフォーマンスを改善しました。

機能

  • 以下の新しい SerDe のサポートを導入しました。

  • 米国東部 (オハイオ) リージョン (us-east-2) での起動。このリージョンでクエリを実行できるようになりました。

  • これで [Create Table From S3 bucket data] (S3 バケットデータからテーブルを作成) フォームを使用して、テーブルスキーマを一括で定義できるようになりました。クエリエディタで [Create] (作成)、[S3 bucket data] (S3 バケットデータ) と選択し、さらに [Column details] (列の詳細) セクションの [Bulk add columns] (列の一括追加) を選択します。

    [列の一括追加] オプション。

    テキストボックスに名前と値のペアを入力し、[Add] を選択します。

    [列の一括追加] テキストボックス。

改良点

  • 大規模な Parquet テーブルのパフォーマンスを改善しました。