リリースノート
Amazon Athena の特徴、改良点、およびバグ修正についてリリース日順に説明します。
Athena リリースノート (2024 年)
2024 年 10 月 30 日
公開日: 2024 年 10 月 30 日
Athena が JDBC ドライバーバージョン 3.3.0 をリリースしました。このバージョンのドライバーの詳細については、「Amazon Athena ODBC 3.x リリースノート」を参照してください。JDBC 3.x ドライバーをダウンロードするには、「JDBC 3.x ドライバーのダウンロード」を参照してください。
2024 年 8 月 23 日
公開日: 2024 年 9 月 5 日
Athena は、次の発表をしました。
-
パススルークエリによるフェデレーションビューのクエリ — フェデレーションパススルークエリがビューでサポートされるようになりました。詳細については、「フェデレーテッドビューをクエリする」を参照してください。
-
複数のパススルークエリ – 同じクエリ実行で複数のフェデレーションパススルークエリを実行できるようになりました。詳細については、「フェデレーテッドパススルークエリを使用する」を参照してください。
-
Iceberg テーブルの OPTIMIZE 修正 — 関連付けられた削除ファイルを持つデータファイルを書き換えるときに、Iceberg テーブルで
OPTIMIZE
を実行しても「削除」ファイルが削除されない問題を修正しました。詳細については、「OPTIMIZE」を参照してください。 -
Parquet LZ4 および LZO 書き込みサポート – Athena は、LZ4 または LZO 形式で圧縮された Parquet ファイルの書き込みをサポートしなくなりました。これらの圧縮形式の読み取りは引き続きサポートされています。Athena での圧縮形式については、「Athena で圧縮を使用する」を参照してください。
2024 年 7 月 29 日
公開日: 2024 年 7 月 29 日
Athena が JDBC ドライバーバージョン 3.2.2 をリリースしました。このバージョンのドライバーの詳細については、「Amazon Athena ODBC 3.x リリースノート」を参照してください。JDBC 3.x ドライバーをダウンロードするには、「JDBC 3.x ドライバーのダウンロード」を参照してください。
2024 年 7 月 26 日
公開日: 2024 年 8 月 1 日
Athena は、次の改善を発表しました。
-
Delta Lake テーブル削除ベクトルのサポート – Athena は、削除ベクトル
を持つ Delta Lake テーブルからの読み取りをサポートするようになりました。詳細については、「Linux Foundation Delta Lake テーブルをクエリする」を参照してください。
2024 年 7 月 3 日
公開日: 2024 年 7 月 3 日
Athena が JDBC ドライバーバージョン 3.2.1 をリリースしました。このバージョンのドライバーの詳細については、「Amazon Athena ODBC 3.x リリースノート」を参照してください。JDBC 3.x ドライバーをダウンロードするには、「JDBC 3.x ドライバーのダウンロード」を参照してください。
2024 年 6 月 26 日
公開日: 2024 年 6 月 26 日
南米 (サンパウロ) および欧州 (スペイン) リージョンでプロビジョニングされた容量が一般に利用可能になりました。プロビジョニングされた容量を使用することで、フルマネージドコンピューティング性能で SQL クエリを実行し、最も重要なインタラクティブなワークロードの優先順位付け、制御、スケーリングを行うワークロード管理機能を提供できます。いつでも容量を追加して、同時に実行するクエリの数を増やしたり、そのキャパシティを使用するワークロードを制御したり、ワークロード間でキャパシティを共有したりできます。
詳細については、「クエリ処理キャパシティを管理する」を参照してください。料金の詳細については、「Amazon Athena 料金表
2024 年 5 月 10 日
公開日: 2024 年 7 月 15 日
Athena は、次の機能と改善点を発表しました。
-
Delta Lake – Athena は、チェックポイントファイルから不要なエントリを除外する最適化を追加しました。これらの最適化により、多くの Parquet データファイルを参照する大きなチェックポイントファイルを持つクエリのパフォーマンスが大幅に改善します。
Athena で Linux Foundation Delta Lake テーブルの使用については、「Linux Foundation Delta Lake テーブルをクエリする」を参照してください。
2024 年 4 月 26 日
公開日: 2024 年 4 月 26 日
Athena が JDBC ドライバーバージョン 3.2.0 をリリースしました。このバージョンのドライバーの詳細については、「Amazon Athena ODBC 3.x リリースノート」を参照してください。JDBC 3.x ドライバーをダウンロードするには、「JDBC 3.x ドライバーのダウンロード」を参照してください。
2024 年 4 月 24 日
公開日: 2024 年 4 月 24 日
Athena は、次の修正と改善を発表しました。
-
Parquet – Athena は、リストやマップグループに含まれていない、注釈のない繰り返しプリミティブフィールドに対して、Parquet での下位互換性のある読み取りをサポートするようになりました。この変更により、正しくない結果がそのまま返されることがなくなり、スキーマの不一致に対するエラーメッセージが改善されました。
詳細については、GitHub.com の Parquet の「Support backwards compatible reads for unannotated repeated primitive fields in Parquet
」(注釈のない繰り返しプリミティブフィールドに対する下位互換性のある読み取りのサポート) を参照してください。 -
Iceberg OPTIMIZE – 非パーティションキーフィルターが
WHERE
句で使用されたときにデータが失われる原因となるOPTIMIZE
クエリの問題を解決しました。詳細については、「OPTIMIZE」を参照してください。
2024 年 4 月 16 日
公開日: 2024 年 4 月 16 日
新しい Amazon Athena フェデレーテッドクエリパススルー機能を使用して、クエリの全体を基盤となるデータソースで直接実行します。フェデレーテッドパススルークエリは、元のデータソース固有の関数、クエリ言語、パフォーマンス機能を活用できるようにします。たとえば、PartiQL 言語を使用して、DynamoDB で Athena クエリを実行することができます。フェデレーテッドパススルークエリは、Athena では使用できないデータソースの関数を集約、結合、または呼び出す SELECT
クエリを実行する場合にも役立ちます。パススルークエリを使用することで Athena が処理するデータの量が低減するため、クエリ時間の短縮につながります。
詳細については、「フェデレーテッドパススルークエリを使用する」を参照してください。現在使用しているコネクタを最新バージョンにアップグレードするには、「データソースコネクタを更新する」を参照してください。
2024 年 4 月 10 日
公開日: 2024 年 4 月 10 日
Athena は、次の機能と改善点を発表しました。
ODBC 1.2.3.1000 ドライバー
Athena 用の ODBC 1.2.3.1000 ドライバーがリリースされました。
解決された問題:
-
プロキシサーバーの接続問題 – ルート証明書なしでプロキシサーバーを使用すると、コネクタが接続の確立に失敗していました。
ODBC 1.x ドライバー、リリースノート、ドキュメントのダウンロード、および詳細については、「Athena ODBC 1.x ドライバー」を参照してください。
JDBC 2.1.5 ドライバー
Athena 用の JBDC 2.1.5 ドライバーがリリースされました。
更新と機能拡張:
-
バージョン 1.12.687 を使用するように AWS Java SDK を更新しました。
-
バージョン 2.16.0 を使用するように Jackson ライブラリを更新しました。
-
バージョン 1.3.14 を使用するように Logback ライブラリを更新しました。
JDBC 2.x ドライバー、リリースノート、ドキュメントのダウンロード、および詳細については、「Athena JDBC 2.x ドライバー」を参照してください。
2024 年 4 月 8 日
公開日: 2024 年 4 月 8 日
Athena が ODBC ドライバーバージョン 2.0.3.0. を発表しました。詳細については、2.0.3.0 のリリースノートを参照してください。新しい ODBC v2 ドライバーをダウンロードするには、「ODBC 2.x ドライバーのダウンロード」を参照してください。接続情報については、「Amazon Athena ODBC 2.x」を参照してください。
2024 年 3 月 15 日
公開日: 2024 年 3 月 18 日
Amazon Athena が、カナダ西部 (カルガリー) リージョンでの Athena SQL の提供開始を発表しました。
各 AWS リージョン で利用できる AWS のサービス の一覧については、「地域別の AWS サービス
2024 年 2 月 15 日
公開日: 2024 年 2 月 15 日
Athena が JDBC ドライバーバージョン 3.1.0 をリリースしました。
Amazon Athena JDBC ドライバーバージョン 3.1.0 は、Microsoft Active Directory Federation Services (AD FS) Windows 統合認証と、フォームベース認証のサポートを追加します。3.1.0 リリースには、その他の軽微な改善とバグ修正も含まれています。
JDBC v3 ドライバーをダウンロードするには、「JDBC 3.x ドライバーのダウンロード」を参照してください。
2024 年 1 月 31 日
公開日: 2024 年 1 月 31 日
Athena は、次の機能と改善点を発表しました。
-
Hudi アップグレード – Athena SQL を使用して Hudi 0.14.0 テーブルをクエリできるようになりました。HUDI テーブルをクエリするための Athena SQL の使用については、「Apache Hudi データセットをクエリする」を参照してください。
Athena リリースノート (2023 年)
2023 年 12 月 14 日
公開日: 2023 年 12 月 14 日
Athena は、次の修正と改善を発表しました。
Athena は、JDBC ドライバーのバージョン 2.1.3 をリリースしました。ドライバーは次の問題を解決します。
-
Spring Boot や Gradle アプリケーションのロギングとの競合を避けるため、ロギングが改善されました。
-
executeBatch()
JDBC メソッドを使用してレコードを挿入する際、ドライバーが誤って 1 つのレコードのみを挿入しました。Athena はクエリのバッチ実行をサポートしていないため、executeBatch()
使用時にドライバーがエラーを報告するようになりました。この制限を回避するには、1 つのクエリをループで送信できます。
新しい JDBC ドライバー、リリースノート、およびドキュメントをダウンロードするには、「Athena JDBC 2.x ドライバー」を参照してください。
2023 年 12 月 9 日
公開日: 2023 年 12 月 9 日
Athena 用の ODBC 1.2.1.1000 ドライバーがリリースされました。
特徴と拡張機能:
-
RStudio サポートの更新 — ODBC ドライバーが macOS 上の RStudio をサポートするようになりました。
-
単一のカタログとスキーマのサポート — コネクタが 1 つのカタログとスキーマを返すことができるようになりました。詳細については、ダウンロード可能なインストールおよび設定ガイドを参照してください。
解決された問題:
-
準備済みステートメント — 列単位のスキーマを使用するパラメータ配列を含む準備済みステートメントを実行すると、コネクタが誤ったクエリ結果を返しました。
-
列サイズ —
$file_modified_time
システム列を選択すると、コネクタが誤った列サイズを返しました。 -
SQLPrepare —
SELECT
クエリに対してSQLPrepare
に関連するパラメータをバインドすると、コネクタがエラーを返しました。
詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「Athena ODBC 1.x ドライバー」を参照してください。
2023 年 12 月 7 日
公開日: 2023 年 12 月 7 日
Athena は ODBC ドライバーバージョン 2.0.2.1 を発表しました。詳細については、2.0.2.1 のリリースノートを参照してください。新しい ODBC v2 ドライバーをダウンロードするには、「ODBC 2.x ドライバーのダウンロード」を参照してください。接続情報については、「Amazon Athena ODBC 2.x」を参照してください。
2023 年 12 月 5 日
公開日: 2023 年 12 月 5 日
AWS IAM Identity Center 認証モードを使用する Athena SQL ワークグループを作成できるようになりました。これらのワークグループは IAM アイデンティティセンターの信頼できる ID 伝達機能をサポートしています。信頼できる ID 伝達により、Amazon Athena や Amazon EMR Studio などの AWS 分析サービスでアイデンティティを使用できるようになります。
詳細については、「IAM アイデンティティセンターが有効な Athena ワークグループを使用する」を参照してください。
2023 年 11 月 28 日
公開日: 2023 年 11 月 28 日
Amazon S3 Express One Zone ストレージクラス
詳細については、「S3 Express One Zone データをクエリする」を参照してください。
2023 年 11 月 27 日
公開日: 2023 年 11 月 27 日
Athena は、次の機能と改善点を発表しました。
-
Glue データカタログビュー — Glue データカタログビューは、Amazon Athena や Amazon Redshift などの AWS サービスに共通する 1 つのビューを提供します。Glue データカタログビューでは、アクセス許可はビューをクエリするユーザーではなく、ビューを作成したユーザーによって定義されます。これらのビューを使用することで、アクセスコントロールの強化、完全なレコードの確保、セキュリティの強化、基礎となるテーブルへのアクセスの防止を実現することができます。
詳細については、「Athena でデータカタログビューを使用する」を参照してください。
-
CloudTrail Lake のサポート — Amazon Athena を使用して AWS CloudTrail LakeAWS CloudTrail のデータを分析できるようになりました。Lake は CloudTrail 用のマネージドデータレイクであり、監査、セキュリティ、運用調査のためのアクティビティログの集約、不変的な保存、分析に使用できます。Athena から CloudTrail Lake アクティビティログをクエリするために、データを移動したり、個別のデータ処理パイプラインを構築したりする必要はありません。ETL オペレーションは必要ありません。
開始するには、CloudTrail Lake でデータフェデレーションを有効にします。CloudTrail Lake イベントデータストアのメタデータを AWS Glue Data Catalog と共有すると、CloudTrail は必要な AWS Glue Data Catalog リソースを作成し、データを AWS Lake Formation に登録します。Lake Formation では、Athena を使用してイベントデータストアをクエリできるユーザーとロールを指定できます。
詳細については、「AWS CloudTrail ユーザーガイド」の「Enable Lake query federation」を参照してください。
2023 年 11 月 17 日
公開日: 2023 年 11 月 17 日
Athena は、次の機能と改善点を発表しました。
機能
-
コストベースオプティマイザー — Athena は、AWS Glue の統計を使用したコストベースの最適化の一般提供を発表しました。Athena SQL のクエリを最適化するには、Athena がテーブルを収集するようにリクエストするか、AWS Glue のテーブルの列レベル統計を収集するようにリクエストできます。クエリのすべてのテーブルに統計がある場合、Athena はその統計を使用して代替の実行プランを調べたうえ、最も速いと思われる実行プランを選択します。
詳細については、「コストベースオプティマイザーを使用する」を参照してください。
-
Amazon EMR Studio の統合 — Athena コンソールを直接使用することなく、Amazon EMR Studio で Athena を使用できるようになりました。Amazon EMR で Athena 統合を使用すると、次のタスクを実行できます。
-
Athena SQL クエリの実行
-
クエリ結果を表示する
-
クエリ履歴の表示
-
保存されたクエリの表示
-
パラメータ化されたクエリの実行
-
データカタログのデータベース、テーブル、ビューの表示
詳細については、AWS のサービス における Athena との統合 トピックの「Amazon EMR Studio」を参照してください。
-
-
ネストされたアクセス制御 — Athena が、ネストされたデータの Lake Formation アクセス制御のサポートを発表しました。Lake Formation では、
struct
データ型を持つネストされた列にデータフィルターを定義して適用できます。データフィルタリングを使用し、ネストされた列のサブ構造へのユーザーアクセスを制限できます。ネストされたデータにデータフィルターを作成する方法の詳細については、「AWS Lake Formation デベロッパーガイド」の「データフィルターの作成」を参照してください。 -
プロビジョニングされたキャパシティーの使用状況メトリクス — Athena は、キャパシティ予約の新しい CloudWatch メトリクスを発表しました。新しいメトリクスを使用して、プロビジョニングした DPU の数とクエリによって使用されている DPU 数を管理できます。クエリが終了すると、クエリが消費した DPU 数も表示できます。
詳細については、「CloudWatch による Athena クエリメトリクスのモニタリング」を参照してください。
改良点
-
エラーメッセージの変更 —
Insufficient Lake Formation permissions
エラーメッセージはTable not found
またはSchema not found
として表示されるようになりました。この変更は、悪意のある攻撃者がエラーメッセージからテーブルまたはデータベースリソースの存在を推測するのを防ぐために行われました。
2023 年 11 月 16 日
公開日: 2023 年 11 月 16 日
Athena は、互換性のある SQL 開発およびビジネスインテリジェンスアプリケーションからデータへの接続、クエリ、視覚化のエクスペリエンスを向上させる新しい JDBC ドライバーをリリースしました。新しいドライバーは簡単にアップグレードできます。ドライバーは Amazon S3 から直接クエリ結果を読み取り、クエリ結果をより早く利用可能にします。
詳細については、「Athena JDBC 3.x ドライバー」を参照してください。
2023 年 10 月 31 日
公開日: 2023 年 10 月 31 日
Amazon Athena は、プロビジョニングされたキャパシティの 1 時間の予約を発表しました。本日より、1 時間後にプロビジョニングされたキャパシティを予約して解放できます。この変更により、時間ととも需要が変化するワークロードのコスト最適化が容易になります。
プロビジョニングされたキャパシティは Atena の機能であり、最も重要なインタラクティブワークロードの優先、制御、スケーリングを行えるようにするワークロード管理機能 いつでも容量を追加して、同時に実行するクエリの数を増やしたり、そのキャパシティを使用するワークロードを制御したり、ワークロード間でキャパシティを共有したりできます。
詳細については、「クエリ処理キャパシティを管理する」を参照してください。料金の詳細については、「Amazon Athena 料金表
2023 年 10 月 25 日
公開日: 2023 年 10 月 26 日
Athena は、次の修正と改善を発表しました。
jackson-core パッケージ — 1,000 文字を超える数値の JSON テキストは失敗するようになりました。この修正は「sonatype-2022-6438
2023 年 10 月 17 日
公開日: 2023 年 10 月 17 日
Athena は ODBC ドライバーバージョン 2.0.2.0 を発表しました。詳細については、2.0.2.0 のリリースノートを参照してください。新しい ODBC v2 ドライバーをダウンロードするには、「ODBC 2.x ドライバーのダウンロード」を参照してください。接続情報については、「Amazon Athena ODBC 2.x」を参照してください。
2023 年 9 月 26 日
公開日: 2023 年 9 月 26 日
Athena は、次の機能と改善点を発表しました。
-
Delta Lake テーブルの Lake Formation 読み取りサポート。Athena で Delta Lake テーブルの使用に関する詳細については、「Linux Foundation Delta Lake テーブルをクエリする」を参照してください。
2023 年 8 月 23 日
公開日: 2023 年 8 月 23 日
Amazon Athena は、イスラエル (テルアビブ) リージョンで Athena SQL が利用可能になったことを発表しました。
各 AWS リージョン で利用できる AWS のサービス の一覧については、「地域別の AWS サービス
2023 年 8 月 10 日
公開日: 2023 年 8 月 10 日
Athena は、次の修正と改善を発表しました。
ODBC ドライバーバージョン 2.0.1.1
Athena は ODBC ドライバーバージョン 2.0.1.1 を発表しました。詳細については、2.0.1.1 のリリースノートを参照してください。新しい ODBC v2 ドライバーをダウンロードするには、「ODBC 2.x ドライバーのダウンロード」を参照してください。接続情報については、「Amazon Athena ODBC 2.x」を参照してください。
JDBC ドライバーバージョン 2.1.1
Athena は、JDBC ドライバーのバージョン 2.1.1 をリリースしました。ドライバーは次の問題を解決します。
-
正規表現を含むステートメントを使用してテーブルが作成されたときに発生していたエラー。
-
ApplicationName
接続パラメータが正しく適用されない原因となっていた問題。
新しい JDBC ドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。
2023 年 7 月 31 日
公開日: 2023 年 7 月 31 日
Amazon Athena は、追加の AWS リージョンで Athena SQL が利用可能になったことを発表しました。
このリリースでは、Athena SQL の提供地域を、アジアパシフィック (ハイデラバード)、アジアパシフィック (メルボルン)、欧州 (スペイン)、欧州 (チューリッヒ) に拡大します。
各 AWS リージョン で利用できる AWS のサービス の一覧については、「地域別の AWS サービス
2023 年 7 月 27 日
公開日: 2023 年 7 月 27 日
Athena では、Google BigQuery コネクタバージョン 2023.30.1 がリリースされました。このバージョンのコネクタでは、クエリの実行時間が短縮され、BigQuery プライベートエンドポイントに対するクエリのサポートが追加されました。
Google BigQuery コネクタの詳細については、「Amazon Athena Google BigQuery コネクタ」を参照してください。既存のデータソースコネクタの更新については、「データソースコネクタを更新する」を参照してください。
2023 年 7 月 24 日
公開日: 2023 年 7 月 24 日
Athena は、次の修正と改善を発表しました。
-
UNION クエリ — 特定のUNION クエリのパフォーマンスが向上しました。
-
型比較による結合 — 2 つの異なる型の比較を含む
JOIN
ステートメントの潜在的なクエリの失敗を修正しました。 -
ネストされた列のサブクエリ — サブクエリがネストされた列に相関しているときにクエリが失敗する問題を修正しました。
-
アイスバーグビュー — Apache Iceberg ビューのタイムスタンプ列の精度に関する互換性の問題を修正しました。タイムスタンプ列を持つ Iceberg ビューが、その列が Athena エンジンバージョン 2 で作成されたか、または Athena エンジンバージョン 3 で作成されたかに関係なく読み取りが可能になりました。
2023 年 7 月 20 日
公開日: 2023 年 7 月 20 日
Athena は、JDBC ドライバーのバージョン 2.1.0 をリリースします。ドライバーに新しい機能拡張が追加されて、問題が解決されました。
機能強化
以下の Jackson
-
jackson-annotations 2.15.2 (以前は 2.14.0)
-
jackson-core 2.15.2 (以前は 2.14.0)
-
jackson-databind 2.15.2 (以前は 2.14.0)
解決された問題
-
sql2o
ライブラリ使用時に配列パラメータを渡す際の問題を修正しました。
詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。
2023 年 7 月 13 日
公開日: 2023 年 9 月 19 日
Athena は、次の機能と改善点を発表しました。
-
EXPLAIN ANALYZE —
EXPLAIN ANALYZE
の出力にキュー、分析、計画、実行時間のサポートを追加しました。 -
EXPLAIN
EXPLAIN — クエリに集約が含まれている場合、出力に統計が表示されるようになりました。 -
Parquet Hive SerDe — Parquet データを読み取る際に処理統計を無視できるようにする
parquet.ignore.statistics
プロパティを追加しました。詳細については、Parquet 統計を無視する を参照してください。
EXPLAIN
と EXPLAIN ANALYZE
の詳細については、「Athena での EXPLAIN および EXPLAIN ANALYZE の使用」を参照してください。Parquet Hive については、「Parquet SerDe」を参照してください。
2023 年 7 月 3 日
公開日: 2023 年 7 月 25 日
Athena では、2023 年 7 月 3 日から CloudTrail ログのクエリ文字列を編集できるようになりました。クエリ文字列の値は ***OMITTED***
になりました。機密情報を含む可能性のあるテーブル名やフィルター値の意図しない漏洩を防止するために、この変更を行いました。これまで CloudTrail ログを使用してクエリ文字列全体にアクセスしていた場合は、Athena::GetQueryExecution
API を使用し、CloudTrail ログから responseElements.queryExecutionId
の値を渡すことをお勧めします。詳細については、「Amazon Athena API リファレンス」の「GetQueryExecution」ページのアクションを参照してください。
2023 年 6 月 30 日
公開日: 2023 年 6 月 30 日
Athena クエリエディタで、クエリの作成を高速化するための先行入力コード候補がサポートされるようになりました。次の機能を使用して、SQL クエリをより正確に、より効率的に記述できるようになりました。
-
入力すると、キーワード、ローカル変数、スニペット、およびカタログ項目の候補がリアルタイムで表示されます。
-
データベース名またはテーブル名の後にドットを入力すると、エディタはテーブルまたは列のリストを表示して選択できるため便利です。
-
スニペットの候補にカーソルを合わせると、概要にスニペットの構文と使用法の概要が表示されます。
-
コードの読みやすさを向上させるため、キーワードとその強調表示ルールも Trino と Hive の最新構文に合わせて更新されました。
この機能は、デフォルトでご利用になれます。コードエディタの環境設定でこの機能を有効/無効にできます。
Athena クエリエディタで先行入力コード候補を試すには、Athena コンソール https://console.aws.amazon.com/athena/
2023 年 6 月 29 日
公開日: 2023 年 6 月 29 日
-
Athena は ODBC ドライバーバージョン 2.0.1.0 を発表しました。詳細については、2.0.1.0 のリリースノートを参照してください。新しい ODBC v2 ドライバーをダウンロードするには、「ODBC 2.x ドライバーのダウンロード」を参照してください。接続情報については、「Amazon Athena ODBC 2.x」を参照してください。
-
Athena とその機能
が中東 (UAE) 地域で利用できるようになりました。各 AWS リージョン で利用できる AWS のサービス の一覧については、「地域別の AWS サービス 」を参照してください。
2023 年 6 月 28 日
公開日: 2023 年 6 月 28 日
Amazon Athena を使用して、S3 Glacier Flexible Retrieval (以前の Glacier) と S3 Glacier Deep Archive Amazon S3 ストレージクラスから復元されたオブジェクトをクエリできるようになりました。テーブルごとにこの機能を設定します。この機能は、Athena エンジンバージョン 3 の Apache Hive テーブルでのみサポートされています。
詳細については、「復元された Amazon S3 Glacier オブジェクトをクエリする」を参照してください。
2023 年 6 月 12 日
公開日: 2023 年 6 月 12 日
Athena は、次の修正と改善を発表しました。
-
Parquet Reader のタイムスタンプ — Parquet Reader
のタイムスタンプを bigint
(ミリ秒) として読み取るサポートが追加されました。この更新により、Athena エンジンバージョン 2 のサポートと同等に提供されます。 -
EXPLAIN ANALYZE —
EXPLAIN ANALYZE
のクエリ統計と出力に物理入力の読み取り時間を追加しました。EXPLAIN ANALYZE
の詳細については、「Athena での EXPLAIN および EXPLAIN ANALYZE の使用」を参照してください。 -
INSERT —
INSERT
で書き込まれたテーブルのクエリパフォーマンスが向上しました。INSERT
の詳細については、「INSERT INTO」を参照してください。 -
Delta Lake テーブル — Delta Lake テーブルの
DROP TABLE
が同時に変更された場合に完全に削除できないという問題が修正されました。
2023 年 6 月 8 日
公開日: 2023 年 6 月 8 日
Amazon Athena for Apache Spark が、以下の新機能を発表しました。
-
カスタム Java ライブラリと設定のサポート — Athena の Apache Spark セッションに独自の Java パッケージとカスタム設定を使用できるようになりました。Spark プロパティを使用して、Athena コンソール、AWS CLI、または Athena API で
.jar
ファイル、パッケージ、またはその他のカスタム設定を指定します。詳細については、「Spark プロパティを使用してカスタム設定を指定する」を参照してください。 -
Apache Hudi、Apache Iceberg、Delta Lake テーブルのサポート — Athena for Spark は、Apache Iceberg、Apache Hudi、および Linux Foundation Delta Lake のオープンソースデータレイクストレージテーブル形式をサポートするようになりました。詳細については、「Athena for Spark」での Athena for Spark で Apache Iceberg テーブルを使用する、Athena for Spark で Apache Hudi テーブルを使用する、および Athena for Spark で Linux Foundation Delta Lake テーブルを使用する テーブルの使用に関する「Athena for Spark で Hive 以外のテーブル形式を使用する」および個々のトピックを参照してください。
-
Apache Spark の暗号化サポート — Athena for Spark では、Spark ノード間で転送中のデータと、Spark によってディスクに保存されている保管中のローカルデータの暗号化を有効にできるようになりました。Spark 暗号化を有効にするには、Athena コンソール、AWS CLI、または Athena API を使用できます。詳細については、「Apache Spark 暗号化を有効にする」を参照してください。
Amazon Athena for Apache Spark の詳細については、「Amazon Athena で Apache Spark を使用する」を参照してください。
2023 年 6 月 2 日
公開日: 2023 年 6 月 2 日
Athena でキャパシティ予約を削除し、AWS CloudFormation テンプレートを使用して Athena キャパシティ予約を指定できるようになりました。
-
キャパシティ予約の削除 – Athena でキャンセルされたキャパシティ予約を削除できるようになりました。予約は削除する前にキャンセルする必要があります。キャパシティ予約を削除すると、予約はアカウントからすぐに削除されます。削除された予約は参照できなくなります (ARN を使用する場合を含む)。予約を削除するために、Athena コンソールまたは Athena API を使用できます。詳細については、「Amazon Athena ユーザーガイド」の「キャパシティ予約を削除する」、および「Amazon Athena API リファレンス」の「DeleteCapacityReservationページのアクションを参照してください。」を参照してください。
-
キャパシティ予約に AWS CloudFormation テンプレートを使用 – AWS CloudFormation テンプレートと
AWS::Athena::CapacityReservation
リソースを使用して Athena キャパシティ予約を指定できるようになりました。詳細については、「AWS CloudFormation ユーザーガイド」の「AWS::Athena::CapacityReservation」を参照してください。
キャパシティ予約を使用して Athena でキャパシティをプロビジョニングする方法の詳細については、「クエリ処理キャパシティを管理する」を参照してください。
2023 年 5 月 25 日
公開日: 2023 年 5 月 25 日
Athena は、データソースコネクタのアップデートをリリースしました。このアップデートにより、フェデレーテッドクエリのパフォーマンスが改善されます。新しいプッシュダウンの最適化と動的フィルタリングにより、Athena ではなくソースデータベースでより多くのオペレーションを実行できるようになります。これらの最適化により、クエリのランタイムとスキャンされるデータ量が削減されます。これらの改善の恩恵を受けるには、Athena エンジンバージョン 3 が必要です。
次のコネクタが更新されました。
データソースコネクタのアップグレードについては、「データソースコネクタを更新する」を参照してください。
2023 年 5 月 18 日
公開日: 2023 年 5 月 18 日
Amazon Athena への IPv6 インバウンド接続に AWS PrivateLink を使用できるようになりました。
Amazon Athena は、AWS PrivateLink
インターネットの急速な成長により、利用可能なインターネットプロトコルバージョン 4 (IPv4) アドレスが枯渇しつつあります。IPv6 では、使用可能なアドレスの数が数倍に増加するため、VPC 内で重複するアドレス空間を管理する必要がなくなりました。このリリースでは、IPv6 アドレス指定の利点と、AWS PrivateLink のセキュリティおよびパフォーマンスの利点を組み合わせることができるようになりました。
プログラムにより AWS サービスに接続するには、AWS CLI
2023 年 5 月 15 日
公開日: 2023 年 5 月 15 日
Athena は、DynamoDB、CloudWatch Logs、CloudWatch Metrics、AWS CMDB 用の Apache Spark DataSourceV2 (DSV2) コネクタのリリースを発表しました。新しい DSV2 コネクタで Spark を使用してこれらのデータソースをクエリできます。DSV2 コネクタは、対応する Athena フェデレーテッドコネクタと同じパラメータを使用します。DSV2 コネクタは Spark ワーカー上で直接実行されるため、使用するために Lambda 関数をデプロイする必要はありません。
詳細については、「Apache Spark のデータソースコネクタを操作する」を参照してください。
2023 年 5 月 10 日
公開日: 2023 年 5 月 10 日
Athena 用の ODBC 1.1.20 ドライバーがリリースされました。
特徴と拡張機能:
-
Lake Formation エンドポイントのオーバーライドのサポート。
-
ADFS 認証プラグインには、証明書利用者の値 (
LoginToRP
) を設定するための新しいパラメータがあります。 -
AWS ライブラリの更新。
バグ修正:
-
SQLPrepare()
メソッドの送信に失敗した場合における、プリペアドステートメントの割り当て解除の失敗。 -
C 型を SQL 型に変換する場合における、プリペアドステートメントパラメータのバインドエラー。
-
EXPLAIN
およびEXPLAIN ANALYZE
クエリがSQLPrepare()
およびSQLExecute()
を使用した場合における、データが返されないエラー。
詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「ODBC で Amazon Athena に接続する」を参照してください。
2023 年 5 月 8 日
公開日: 2023 年 5 月 8 日
Athena は、次の修正と改善を発表しました。
-
Hudi 統合の更新 – Athena は、Apache Hudi との統合を更新しました。Athena を使用して Hudi 0.12.2 テーブルをクエリできるようになり、Hudi テーブルの Hudi メタデータのリストがサポートされるようになりました。詳細については、「Apache Hudi データセットをクエリする」および「Hudi メタデータを使用してパフォーマンスを改善する」を参照してください。
-
タイムスタンプ変換の修正 - 精度の低いデータ型へのタイムスタンプ変換の処理を修正しました。以前は、Athena エンジンバージョン 3 は、キャスト中に値を切り捨てるのではなく、ターゲットタイプに誤って丸めていました。
次の例は、修正前の誤った処理を示しています。
例 1: マイクロ秒単位のタイムスタンプからミリ秒単位へのキャスト
サンプルデータ
A, 2020-06-10 15:55:23.383 B, 2020-06-10 15:55:23.382 C, 2020-06-10 15:55:23.383345 D, 2020-06-10 15:55:23.383945 E, 2020-06-10 15:55:23.383345734 F, 2020-06-10 15:55:23.383945278
次のクエリは、特定の値に一致するタイムスタンプの取得を試みます。
SELECT * FROM table WHERE timestamps.col = timestamp'2020-06-10 15:55:23.383'
クエリは次の結果を返しました。
A, 2020-06-10 15:55:23.383 C, 2020-06-10 15:55:23.383 E, 2020-06-10 15:55:23.383
修正前は、Athena に値
2020-06-10 15:55:23.383945
または2020-06-10 15:55:23.383945278
が含まれていません。これは、この値が2020-06-10 15:55:23.384
に丸められていたためです。例 2: タイムスタンプから日付へのキャスト
次のクエリは誤った結果を返していました。
SELECT date(timestamp '2020-12-31 23:59:59.999')
結果
2021-01-01
修正前は、Athena が値を切り上げていたため、日付が進んでいました。このような値は、切り上げるのではなく、切り捨てられるようになりました。
2023 年 4 月 28 日
公開日: 2023 年 4 月 28 日
Amazon Athena でキャパシティ予約を使用して、フルマネージドコンピューティング性能で SQL クエリを実行できるようになりました。
プロビジョンドキャパシティのワークロード管理機能により、最も重要なインタラクティブなワークロードの優先順位付け、制御、スケーリングを行えます。いつでも容量を追加して、同時に実行するクエリの数を増やしたり、そのキャパシティを使用するワークロードを制御したり、ワークロード間でキャパシティを共有したりできます。
詳細については、「クエリ処理キャパシティを管理する」を参照してください。料金の詳細については、「Amazon Athena 料金表
2023 年 4 月 17 日
公開日: 2023 年 4 月 17 日
Athena は、JDBC ドライバーのバージョン 2.0.36 をリリースします。ドライバーに新機能を追加し、問題を解決しました。
新機能
-
AD FS 認証でカスタマイズ可能な依存パーティ識別子を使用できるようになりました。
-
コネクタを使用しているアプリケーションの名前をユーザーエージェント文字列に追加できるようになりました。
解決された問題
-
getSchema()
が存在しないスキーマの取得に使用されたときに発生したエラーを修正しました。
詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。
2023 年 4 月 14 日
公開日: 2023 年 6 月 20 日
Athena は、次の修正と改善を発表しました。
-
文字列をタイムスタンプにキャストする場合、日付と時刻またはタイムゾーンの間にスペースが必要です。詳細については、「文字列からタイムスタンプにキャストする際に日付と時刻の値の間に必要なスペース」を参照してください。
-
タイムスタンプの精度の処理方法において、互換性を失う可能性のある変更を削除しました。Athena エンジンバージョン 2 と Athena エンジンバージョン 3 との整合性を維持するために、タイムスタンプの精度は、デフォルトでマイクロ秒ではなくミリ秒単位を使用するようになりました。
-
Athena は、クエリを実行するときに、クエリ出力バケットへのアクセスを常時強制するようになりました。StartQueryExecution アクションを実行するすべての IAM プリンシパルが、クエリ出力バケットに対する S3:GetBucketLocation 権限を持っていることを確認してください。
2023 年 4 月 4 日
公開日: 2023 年 4 月 4 日
Amazon Athenaを使用して、フェデレーティッドデータソースでビューを作成してクエリできるようになりました。1 つのフェデレーティッドビューを使用して、複数の外部テーブルまたはデータのサブセットをクエリできます。これにより、必要な SQL が簡略化され、SQL を使用してデータをクエリする必要があるエンドユーザーからのデータソースを柔軟に難読化できます。
詳細については、ビューを使用するおよびフェデレーティッドクエリを使用するを参照してください。
2023 年 3 月 30 日
公開日: 2023 年 3 月 30 日
Amazon Athena からのお知らせとして、 Amazon Athena for Apache Spark を利用できる AWS リージョン が追加されました。
このリリースでは、Amazon Athena for Apache Spark の提供地域を、アジアパシフィック (ムンバイ)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、欧州 (フランクフルト) に拡大します。
Amazon Athena for Apache Spark の詳細については、「Amazon Athena で Apache Spark を使用する」を参照してください。
2023 年 3 月 28 日
公開日: 2023 年 3 月 28 日
Athena は、次の修正と改善を発表しました。
-
GetQueryExecution
とBatchGetQueryExecution
Athena API アクションに対応して、新しいsubStatementType
フィールドには、実行されたクエリのタイプ (SELECT
、INSERT
、UNLOAD
、CREATE_TABLE
、CREATE_TABLE_AS_SELECT
など) が表示されます。 -
Apache Hive の書き込み操作でマニフェストファイルが正しく暗号化されなかったバグを修正しました。
-
Athena エンジンバージョン 3 は
approx_percentile
関数内のNaN
およびInfinity
値を正しく処理するようになりました。このapprox_percentile
関数は、指定されたパーセンテージでデータセットの近似パーセンタイルを返します。Athena エンジンバージョン 2 では、
NaN
をInfinity
より大きい値として誤って処理します。Athena エンジンバージョン 3 では、NaN
およびInfinity
の扱いを、他の分析関数や統計関数における扱いに従って処理します。以下で、新しい動作について詳しく説明します。-
NaN
がデータセットに存在する場合、Athena はNaN
を返します。 -
NaN
が存在せずInfinity
が存在する場合、Athena はInfinity
を非常に大きな数として扱います。 -
Infinity
値が複数存在する場合、Athena はそれらを非常に大きな、同一の数として扱います。必要に応じて、Athena はInfinity
を出力します。 -
1 つのデータセットに -
Infinity
と-Double.MAX_VALUE
が両方含まれ、パーセンタイルの結果が-Double.MAX_VALUE
の場合、Athena は-Infinity
を返します。 -
1 つのデータセットに
Infinity
とDouble.MAX_VALUE
が両方含まれ、パーセンタイルの結果がDouble.MAX_VALUE
の場合、Athena はInfinity
を返します。 -
Infinity
とNaN
を計算から除外するには、次の例のようにis_finite()
関数を使用します。approx_percentile(x, 0.5) FILTER (WHERE is_finite(x))
-
2023 年 3 月 27 日
公開日: 2023 年 3 月 27 日
Amazon Athena の Athena SQL ワークグループに対して、最小レベルの暗号化を指定できるようになりました。この機能により、Athena SQL ワークグループのすべてのクエリの結果が、指定した暗号化レベル以上で暗号化されます。暗号化強度を複数レベルから選択し、データを保護できます。暗号化レベルの下限を設定するには、Athena コンソール、AWS CLI、API、または SDK を使用します。
Apache Spark 対応のワークグループでは、暗号化の下限設定機能は使用できません。詳細については、「ワークグループの最低限の暗号化を設定する」を参照してください。
2023 年 3 月 17 日
公開日: 2023 年 3 月 17 日
Athena は、次の修正と改善を発表しました。
-
Amazon Athena DynamoDB コネクタで、「
KeyConditionExpressions にはキーごとに 1 つの条件のみ含める必要があります
」というエラーメッセージが表示されてクエリが失敗する問題を修正しました。この問題が発生するのは、Athena エンジンバージョン 3 では、Athena エンジンバージョン 2 よりも多くの種類の述語をプッシュダウンする可能性があるためです。Athena エンジンバージョン 3 では、
some_column LIKE 'someprefix%
のような句は、特定の列に下限と上限を適用するフィルター述語としてプッシュダウンされます。Athena エンジンのバージョン 2 では、これらの述語がプッシュダウンされることはありませんでした。Athena エンジンバージョン 3 では、some_column
がソートキー列の場合、エンジンはフィルター述語を DynamoDB コネクタにプッシュダウンします。その後、フィルター述語はさらに DynamoDB サービスにプッシュダウンされます。DynamoDB はソートキーに対して複数のフィルター条件をサポートしていないため、DynamoDB はエラーを返します。この問題を修正するには、Amazon Athena DynamoDB コネクタをバージョン 2023.11.1 に更新してください。コネクタを更新する手順については、「データソースコネクタを更新する」を参照してください。
2023 年 3 月 8 日
公開日: 2023 年 3 月 8 日
Athena は、次の修正と改善を発表しました。
-
タイムスタンプ述語値がミリ秒ではなくマイクロ秒で送信されるフェデレーティッドクエリの問題を修正しました。
2023 年 2 月 15 日
公開日: 2023 年 2 月 15 日
Athena は、次の修正と改善を発表しました。
-
クライアント側の暗号化を使用して Amazon S3 のデータを暗号化し、Iceberg 書き込みオペレーションを実行できるようになりました。
-
Amazon S3 の Iceberg 書き込みオペレーションに関して、サーバー側の暗号化に影響する問題を修正しました。
2023 年 1 月 31 日
公開日: 2023 年 1 月 31 日
Amazon Athena を使用して、Google Cloud Storage 内のデータをクエリできるようになりました。Amazon S3 と同様に、Google Cloud Storage とはデータをバケットに保存するマネージドサービスです。Google Cloud Storage の Athena コネクタを使用して、外部データでインタラクティブなフェデレーションクエリを実行します。
詳細については、「Amazon Athena Google Cloud Storage コネクタ」を参照してください。
2023 年 1 月 20 日
公開日: 2023 年 1 月 20 日
Athena の圧縮サポートの拡張ドキュメントが表示できるようになりました。Hive テーブル圧縮、Iceberg テーブル圧縮 および ZSTD 圧縮レベル に個別のトピックは追加されました。
詳細については、「Athena で圧縮を使用する」を参照してください。
2023 年 1 月 3 日
公開日: 2023 年 1 月 3 日
Athena は、次の更新を発表しました。
-
Hive メタストア用の追加コマンド - Athena を使用すると、自己管理型の Apache Hive メタストアにメタデータカタログとして接続し、Amazon S3 に保存されているデータをクエリできます。今回のリリースでは、
CREATE TABLE AS
(CTAS)、INSERT INTO
および 12 個の追加データ定義言語 (DDL) コマンドを使用して Apache Hive メタストアを操作できるようになりました。この拡張された SQL 機能セットを使用して、Athena から Hive メタストアのスキーマを直接管理できます。詳細については、「外部の Hive メタストアを使用する」を参照してください。
-
JDBC ドライバーのバージョン 2.0.35 - Athena が JDBC ドライバーのバージョン 2.0.35 をリリースします。JDBC 2.0.35 ドライバーには、次の更新が含まれています。
-
ドライバーは Jackson JSON パーサーに対して次のライブラリを使用するようになりました。
-
jackson-annotations 2.14.0 (以前は 2.13.2)
-
jackson-core 2.14.0 (以前は 2.13.2)
-
jackson-databind 2.14.0 (以前は 2.13.2.2)
-
-
JDBC バージョン 4.1 のサポートは中止されました。
詳細については、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。
-
Athena リリースノート (2022 年)
2022 年 12 月 14 日
公開日: 2022 年 12 月 14 日
Kafka 用 Amazon Athena コネクタを使用して、ストリーミングデータに対する SQL クエリを実行できるようになりました。たとえば、Amazon Managed Streaming for Apache Kafka (Amazon MSK) でリアルタイムストリーミングデータに対して分析クエリを実行し、Amazon S3 のデータレイクの履歴データと結合できます。
Kafka 用 Amazon Athena コネクタは、複数のストリーミングエンジンでのクエリをサポートします。Athena を使用すると、Amazon MSK でプロビジョニングされたサーバーレスクラスタ、セルフマネージドの Kafka デプロイ、および Confluent Cloud のストリーミングデータで SQL クエリを実行できます。
詳細については、「Amazon Athena MSK コネクタ」を参照してください。
2022 年 12 月 2 日
公開日: 2022 年 12 月 2 日
Athena は、JDBC ドライバーのバージョン 2.0.34 をリリースします。JDBC 2.0.34 ドライバーには、次の新機能と解決された問題が含まれています。
-
クエリ結果の再利用のサポート - クエリを実行するたびに Athena に結果を再計算させる代わりに、以前に実行したクエリの結果を指定した制限時間まで再利用できるようになりました。詳細については、JDBC のダウンロードページから入手できる「インストールおよび設定ガイド」と「Athena でクエリ結果を再利用する」を参照してください。
-
EC2InstanceMetadata サポート - JDBC ドライバーは、IAM インスタンスプロファイルを使用する Ec2InstanceMetadata 認証方法をサポートするようになりました。
-
文字ベースの例外の修正 - 特定の言語文字を含むクエリで発生した例外を修正しました。
-
脆弱性の修正 - コネクタにパッケージされた AWS 依存関係に関連する脆弱性を修正しました。
詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。
2022 年 11 月 30 日
公開日: 2022 年 11 月 30 日
Athena で Apache Spark アプリケーションと Jupyter 互換ノートブックをインタラクティブに作成および実行できるようになりました。リソースの計画、設定、または管理を行うことなく、Spark を使用して Athena でデータ分析を実行します。処理用の Spark コードを送信し、結果を直接受け取ります。Amazon Athena コンソールのシンプルなノートブックエクスペリエンスを使用して、Python または Athena ノートブック API を使用する を使用して Apache Spark アプリケーションを開発できます。
Amazon Athena の Apache Spark はサーバーレスであり、オンデマンドで自動的にスケーリングされるため、データ量や処理要件の変化に合わせて瞬時に処理できます。
詳細については、「Amazon Athena で Apache Spark を使用する」を参照してください。
2022 年 11 月 18 日
公開日: 2022 年 11 月 18 日
IBM Db2 用の Amazon Athena コネクタを使用して Athena から Db2 をクエリできるようになりました。たとえば、Db2 上のデータウェアハウス、および Amazon S3 内のデータレイクに対して分析クエリを実行できます。
Amazon Athena Db2 コネクタは、Lambda 環境変数を使用して、いくつかの設定オプションを公開します。設定オプション、パラメータ、接続文字列、デプロイ、および制限事項については、「Amazon Athena IBM Db2 コネクタ」を参照してください。
2022 年 11 月 17 日
公開日: 2022 年 11 月 17 日
Athena エンジンのバージョン 3 の Apache Iceberg サポートでは、次の強化された ACID トランザクション機能が提供されるようになりました。
-
ORC と Avro のサポート - Apache Avro
と Apache ORC の行および列ベースのファイル形式を使用して Iceberg テーブルを作成できます。これらの形式に対するサポートは、Parquet 向けの既存のサポートに追加されます。 -
MERGE INTO -
MERGE INTO
コマンドを使用して、大規模なデータを効率的にマージします。MERGE INTO
はINSERT
、UPDATE
、およびDELETE
のオペレーションを 1 つのトランザクションにまとめます。これにより、データパイプラインの処理オーバーヘッドが軽減され、SQL の記述も少なくなります。詳細については、Iceberg テーブルデータを更新するおよびMERGE INTOを参照してください。 -
CTAS と VIEW のサポート -
CREATE TABLE AS SELECT
(CTAS) およびCREATE VIEW
ステートメントを Iceberg テーブルで使用します。詳細については、CREATE TABLE ASおよびCREATE VIEW および CREATE DIALECT VIEWを参照してください。 -
VACUUM サポート -
VACUUM
ステートメントを使用して、不要になったスナップショットやデータを削除することで、データレイクを最適化できます。この機能を使用すると、読み込みパフォーマンスを向上し、GDPRなどのルールの要件を満たすことができます。詳細については、Iceberg テーブルを最適化するおよびVACUUMを参照してください。
これらの新機能には Athena エンジンバージョン 3 が必要であり、Athena がサポートされているすべてのリージョンで利用できます。これらは Athena コンソール
Athena での Iceberg の使用に関する詳細については、「Apache Iceberg テーブルをクエリする」を参照してください。
2022 年 11 月 14 日
公開日: 2022 年 11 月 14 日
Amazon Athena は、IPv6 経由で Athena 関数を呼び出すために使用できるインバウンド接続用の IPv6 エンドポイントをサポートするようになりました。この機能を使用して、IPv6 コンプライアンス要件を満たすことができます。また、IPv4 と IPv6 間のアドレス変換を処理するための追加のネットワーク機器が不要になります。
この機能を使用するには、IPv4 と IPv6 の両方をサポートする新しい Athena デュアルスタックエンドポイントを使用するようにアプリケーションを設定します。デュアルスタックのエンドポイントは、形式 athena.
を使用します。たとえば、米国東部 (バージニア北部) リージョンのデュアルスタックのエンドポイントは region
.api.awsathena.us-east-1.api.aws
です。
デュアルスタックの Athena エンドポイントにリクエストを行うと、エンドポイントは、ネットワークとクライアントが使用するプロトコルに応じて IPv6 または IPv4 アドレスに解決されます。プログラムにより AWS サービスに接続するには、AWS CLI
サービスエンドポイントの詳細については、「AWS サービスエンドポイント」を参照してください。Athena のサービスエンドポイントの詳細については、AWS ドキュメントの「Amazon Athena エンドポイントとクォータ」を参照してください。
インバウンド接続に新しい Athena デュアルスタックエンドポイントを追加料金なしで使用できます。デュアルスタックのエンドポイントは、一般的にすべての AWS リージョン で使用できます。
2022 年 11 月 11 日
公開日: 2022 年 11 月 11 日
Athena は、次の修正と改善を発表しました。
-
Lake Formation のきめ細かいアクセス制御の拡張 - サポートされている任意のファイルまたはテーブル形式で保存されているデータに対して、Athena クエリで AWS Lake Formation
のきめ細かいアクセス制御ポリシーを使用できるようになりました。データフィルターを使用してクエリ結果のデータへのアクセスを制限し、列レベル、行レベル、およびセルレベルのセキュリティを実現するために、Lake Formation では、きめ細かなアクセスコントロールを使用できます。Athena でサポートされているテーブル形式には、Apache Iceberg、Apache Hudi、Apache Hive などがあります。Athena がサポートするすべてのリージョンで、きめ細かなアクセス制御を使用できます。新しい機能が提供され、クエリのパフォーマンスが向上する 、拡張されたテーブルとファイル形式のサポートには Athena エンジンバージョン 3 が必須ですが、Lake Formation でのきめ細かいアクセス制御ポリシーのセットアップ方法は変わりません。 この拡張されたきめ細かいアクセス制御を Athena で使用する場合、次の考慮事項があります。
-
説明 - Lake Formation で定義されている行またはセルのフィルタリング情報とクエリ統計情報は、
EXPLAIN
およびEXPLAIN ANALYZE
の出力に表示されません。Athena のEXPLAIN
については、「Athena での EXPLAIN および EXPLAIN ANALYZE の使用」を参照してください。 -
外部 Hive メタストア - Apache Hive の非表示列はきめ細かいアクセス制御フィルタリングには使用できません。また、Apache Hive の非表示システムテーブルはきめ細かなアクセス制御ではサポートされていません。詳細については、トピック「外部の Hive メタストアを使用する」の「考慮事項と制限事項」を参照してください。
-
クエリ統計 - Lake Formation で行レベルのフィルターが定義されている場合、ステージレベルの入出力行数とデータサイズ情報は Athena クエリ統計に表示されません。Athena クエリの統計情報を表示する方法については、「完了したクエリの統計と実行の詳細を表示する」および「getQueryRuntimeStatistics」を参照してください。
-
ワークグループ - 同じ Athena ワークグループのユーザーは、Lake Formation のきめ細かいアクセス制御によって、ワークグループがアクセスできるように設定したデータを見ることができます。Athena を使用して Lake Formation に登録されたデータをクエリする方法については、「Athena を使用して AWS Lake Formation に登録されたデータをクエリする」を参照してください。
Lake Formation でのきめ細かなアクセス制御の使用方法については、「AWS ビッグデータブログ」の「AWS Lake Formation を使用したきめ細かなアクセス制御の管理
」を参照してください。 -
-
Athena フェデレーションクエリ - Athena フェデレーションクエリでは、
struct
オブジェクト内のフィールド名の元の大文字と小文字が保持されるようになりました。以前は、struct
フィールド名は自動的に小文字になっていました。
2022 年 11 月 8 日
公開日: 2022 年 11 月 8 日
クエリ結果の再利用キャッシュ機能を使用して、Athena でのクエリの繰り返しを高速化できるようになりました。リピートクエリは、最近送信されたクエリと同じ SQL クエリであり、同じ結果が得られます。複数の同じクエリを実行する必要がある場合、結果を再利用するキャッシュを使用すると、結果の生成に必要な時間を短縮できます。結果再利用キャッシュにより、スキャンされるバイト数を減らすことでコストも削減されます。
詳細については、「Athena でクエリ結果を再利用する」を参照してください。
2022 年 10 月 13 日
公開日: 2022 年 10 月 13 日
Athena は、Athena エンジンバージョン 3 を発表しました。
Athena では、SQL クエリエンジンがアップグレードされ、Trino
詳細については、「Athena エンジンバージョン 3」を参照してください。
2022 年 10 月 10 日
公開日: 2022 年 10 月 10 日
Athena は、JDBC ドライバーのバージョン 2.0.33 をリリースします。JDBC 2.0.33 ドライバーには、次の変更が含まれています。
-
新しいドライバーバージョン、JDBC バージョン、およびプラグイン名のプロパティが、認証情報プロバイダクラスのユーザーエージェント文字列に追加されました。
-
エラーメッセージが修正され、必要な情報が追加されました。
-
接続が閉じられたり、Athena のプリペアドステートメントの実行が失敗したりすると、プリペアドステートメントの割り当てが解除されるようになりました。
詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。
2022 年 9 月 23 日
公開日: 2022 年 9 月 26 日
Amazon Athena Neptune コネクタは、列名とテーブル名の大文字と小文字を区別しない照合をサポートするようになりました。
-
Neptune データソースコネクタは、AWS Glue のテーブルの列名がすべて小文字であっても、大文字と小文字を使用する Neptune テーブルの列名を解決できます。 この動作を有効にするには、Neptune コネクタの Lambda 関数で
enable_caseinsensitivematch
環境変数をtrue
に設定します。 -
AWS Glue は小文字のテーブル名のみをサポートしているため、Neptune 用の AWS Glue テーブルを作成する場合は、AWS Glue テーブルパラメータ
"glabel" =
を指定します。table_name
Neptune コネクタの詳細については、「Amazon Athena Neptune コネクタ」を参照してください。
2022 年 9 月 13 日
公開日: 2022 年 9 月 13 日
Athena は、次の修正と改善を発表しました。
-
外部 Hive メタストア — 外部 Hive メタストア (EHMS) に存在しないパーティションが
WHERE
句に含まれている場合、Athena で例外をスローする代わりにNULL
を返すようになりました。 新しい動作は AWS Glue Data Catalog の動作と一致します。 -
パラメータ化されたクエリ — パラメータ化されたクエリの値を
DOUBLE
データ型にキャストできるようになりました。 -
Apache Iceberg — Amazon S3 バケットで Object Lock が有効である場合に、Iceberg テーブルに書き込みオペレーションができるようになりました。
2022 年 8 月 31 日
公開日: 2022 年 8 月 31 日
Amazon Athena では、アジアパシフィック (ジャカルタ) リージョンで Athena とその機能
このリリースで、アジアパシフィックでの Athena の提供が拡張され、アジアパシフィック (香港)、アジアパシフィック (ジャカルタ)、アジアパシフィック (ムンバイ)、アジアパシフィック (大阪)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、およびアジアパシフィック (東京) が含まれるようになりました。これらのリージョンや他のリージョンで利用可能な AWS のサービス の詳細な一覧については、「AWS リージョン 別のサービス表
2022 年 8 月 23 日
公開日: 2022 年 8 月 23 日
Athena Query Federation SDK のリリース v2022.32.1
-
Amazon RDS インスタンスへの SSL ベースの接続用に、Amazon Athena Oracle データソースコネクタのサポートが追加されました。このサポートは、Transport Layer Security (TLS) プロトコルと、クライアントによるサーバーの認証に限定されています。相互認証は Amazon RDS でサポートされていないため、相互認証のサポートは更新に含まれていません。
詳細については、「Amazon Athena Oracle コネクタ」を参照してください。
2022 年 8 月 3 日
公開日: 2022 年 8 月 3 日
Athena で、JDBC ドライバーのバージョン 2.0.32 がリリースされます。JDBC 2.0.32 ドライバーには、次の変更が含まれています。
-
Athena SDK に送信される
User-Agent
文字列が、ドライバーのバージョン、JDBC 仕様のバージョン、認証プラグインの名前を含むように拡張されました。 -
CheckNonProxyHost
パラメータに値が提供されていない場合にスローされるNullPointerException
を修正しました。 -
BrowserSAML 認証プラグインでの
login_url
解析に関する問題を修正しました。 -
UseProxyforIdp
パラメータがtrue
に設定された場合に発生するプロキシのホストの問題を修正しました。
詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。
2022 年 8 月 1 日
公開日: 2022 年 8 月 1 日
Athena が Athena Query Federation SDK と Athena の事前構築済みデータソースコネクタの改善を発表しました。改善には次が含まれます。
-
構造体の解析 – 特定の複雑な構造体がすべてのデータを表示できないという Athena Query Federation SDK の
GlueFieldLexer
の解析の問題を修正しました。この問題は、Athena Query Federation SDK 上に構築されたコネクタに影響を与えました -
AWS Glue テーブル – AWS Glue テーブルの
set
およびdecimal
の列タイプのサポートがさらに追加されました。 -
DynamoDB コネクタ – DynamoDB 属性名の大文字と小文字を無視する機能が追加されました。詳細については、Amazon Athena DynamoDB コネクタ ページの パラメータ セクションにある「
disable_projection_and_casing
」を参照してください。
詳細については、GitHub の「Release v2022.30.2 of Athena Query Federation
2022 年 7 月 21 日
公開日: 2022 年 7 月 21 日
Athena コンソールで、パフォーマンスメトリクスとインタラクティブで視覚的なクエリ分析ツールを使用して、クエリを分析およびデバッグできるようになりました。クエリのパフォーマンスデータと実行の詳細は、クエリのボトルネックの特定、クエリの各ステージの演算子と統計の検査、ステージ間を流れるデータ量の追跡、クエリ述語の影響の検証に役立ちます。これで、次の操作を実行できます。
-
1 回クリックするだけで、クエリの分散型および論理実行プランにアクセスできます。
-
ステージが実行される前に、各ステージでのオペレーションを詳しく確認します。
-
キュー、計画、実行の各段階で費やされた時間のメトリクスを使用して、完了したクエリのパフォーマンスを視覚化します。
-
クエリで処理および出力されたソースデータの行数と量に関する情報を取得します。
-
コンテキストで示され、インタラクティブなグラフとしてフォーマットされたクエリのきめ細かい実行の詳細を表示します。
-
ステージレベルの正確な実行の詳細を使用して、クエリを通じたデータの流れを理解します。
-
新しい API を使用してプログラムでクエリパフォーマンスデータを分析し、クエリランタイム統計を取得します。これも本日リリースされました。
クエリでこれらの機能を使用する方法については、AWS YouTube チャンネルの動画のチュートリアル「Optimize Amazon Athena Queries with New Query Analysis Tools
ドキュメントについては、「SQL クエリの実行プランを表示する」および「完了したクエリの統計と実行の詳細を表示する」を参照してください。
2022 年 7 月 11 日
公開日: 2022 年 7 月 11 日
SQL ステートメントを事前に準備することなく、パラメータ化されたクエリを Athena コンソールまたは API から直接実行できるようになりました。
疑問符形式のパラメータを含むクエリを Athena コンソールで実行すると、パラメータの値を直接入力することを促すプロンプトがユーザーインターフェイスで表示されるようになりました。これにより、クエリを実行するたびにクエリエディタでリテラル値を変更する必要がなくなります。
強化された query execution API を使用する場合、1 回の呼び出しで実行パラメータとその値を指定できるようになりました。
詳細については、このユーザーガイドの「パラメータ化されたクエリを使用する」と「AWS ビッグデータブログ」の記事「Amazon Athena のパラメータ化されたクエリを使用して Data as a Service (DaaS) を提供する
2022 年 7 月 8 日
公開日: 2022 年 7 月 8 日
Athena は、次の修正と改善を発表しました。
-
クエリの失敗を引き起こしていた SageMaker エンドポイント (UDF) の
DATE
列変換処理の問題を修正しました。
2022 年 6 月 6 日
公開日: 2022 年 6 月 6 日
Athena が JDBC ドライバーのバージョン 2.0.31 をリリース。JDBC 2.0.31 ドライバーには、次の変更が含まれています。
-
log4j 依存関係の問題 — log4j 依存関係によって引き起こされる「
ドライバークラスが見つからない
」エラーメッセージを解決しました。
詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。
2022 年 5 月 25 日
公開日: 2022 年 5 月 25 日
Athena は、次の修正と改善を発表しました。
-
Iceberg のサポート
-
クロスリージョンクエリのサポートが導入されました。これにより、使用している AWS リージョンとは異なる AWS リージョンにある Iceberg テーブルをクエリできるようになりました。クロスリージョンクエリは、中国リージョンではサポートされていません。
-
サーバー側暗号化設定のサポートが導入されました。これにより、Amazon S3 での Iceberg 書き込み操作からのデータの暗号化に SSE-S3/SSE-KMS を使用できるようになりました。
Athena での Apache Iceberg の使用に関する詳細については、「Apache Iceberg テーブルをクエリする」を参照してください。
-
-
JDBC 2.0.30 ドライバーリリース
Athena 用の JDBC 2.0.30 ドライバーでは、以下の点が改善されました。
-
パラメータ化されたプリペアドステートメントに影響を及ぼしていたデータ競合の問題を修正。
-
Gradle ビルド環境で発生していたアプリケーションの起動問題を修正。
JDBC 2.0.30 ドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。
-
2022 年 5 月 6 日
公開日: 2022 年 5 月 6 日
Athena 用の JDBC 2.0.29 ドライバー と ODBC 1.1.17 ドライバーがリリースされました。
これらのドライバーには、以下の変更が含まれます。
-
SAML プラグインブラウザの起動プロセスを更新しました。
これらの変更についての詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」および「ODBC で Amazon Athena に接続する」を参照してください。
2022 年 4 月 22 日
公開日: 2022 年 4 月 22 日
Athena は、次の修正と改善を発表しました。
-
次の条件が満たされたときにパーティションキャッシュで発生していた、パーティションインデックスとフィルタリング機能
の問題を修正しました。 -
テーブルの AWS Glue テーブルプロパティで
partition_filtering.enabled
キーがtrue
に設定されている。 -
同じテーブルが異なるパーティションフィルター値で複数回使用されている。
-
2022 年 4 月 21 日
公開日: 2022 年 4 月 21 日
Amazon Athena を使用して、Google BigQuery、Azure Synapse、Snowflake などの新しいデータソースに対してフェデレーティッドクエリを実行できるようになりました。新しいデータソースコネクタには、次のものがあります。
Athena でサポートされるデータソースの完全なリストについては、「使用可能なデータソースコネクタ」を参照してください。
使用可能なソースを参照してデータに接続しやすくなるように、Athena コンソールの新しくなった [Data Sources] (データソース) 画面から使用可能なコネクタを検索、並べ替え、およびフィルターできるようになりました。
フェデレーティッドソースに対するクエリについては、「Amazon Athena 横串検索を使用する」および「フェデレーティッドクエリを使用する」を参照してください。
2022 年 4 月 13 日
公開日: 2022 年 4 月 13 日
Athena は JDBC ドライバーのバージョン 2.0.28 をリリースします。JDBC 2.0.28 ドライバーには、次の変更が含まれています。
-
JWT のサポート - ドライバーが、認証に使用される JSON ウェブトークン (JWT) をサポートするようになりました。JDBC ドライバーでの JWT の使用については、「JDBC ドライバーページ」からダウンロードできるインストールと設定のガイドを参照してください。
-
Log4j ライブラリの更新 - JDBC ドライバーが、次の Log4j ライブラリを使用するようになりました。
-
Log4j-API 2.17.1 (以前は 2.17.0)
-
Log4j-core 2.17.1 (以前は 2.17.0)
-
Log4j-jcl 2.17.2
-
-
その他の改善点 - 新しいドライバーには、以下の改善とバグ修正も含まれています。
-
JDBC を通じて Athena 準備済みステートメント機能を使用できるようになりました。準備済みステートメントについては、「パラメータ化されたクエリを使用する」を参照してください。
-
中国リージョンで Athena JDBC SAML フェデレーションが機能するようになりました。
-
その他の小さな改善。
-
詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。
2022 年 3 月 30 日
公開日: 2022 年 3 月 30 日
Athena は、次の修正と改善を発表しました。
-
クロスリージョンクエリ— Athena を使用して、アジアパシフィック (香港)、中東 (バーレーン)、アフリカ (ケープタウン)、欧州 (ミラノ) を含む AWS リージョン 全体で Amazon S3 バケット内のデータをクエリできるようになりました。クロスリージョンクエリは、中国リージョンではサポートされていません。
-
Athenaが利用できる AWS リージョン のリストについては、「Amazon Athena エンドポイントとクォータ」を参照してください。
-
デフォルトで無効になっている AWS リージョン の有効化の詳細については、「リージョンを有効にする」を参照してください。
-
リージョン間のクエリについては、「リージョン全体でクエリする」を参照してください。
-
2022 年 3 月 18 日
公開日: 2022 年 3 月 18 日
Athena は、次の修正と改善を発表しました。
-
動的フィルタリング – 動的フィルタリングは、対応するテーブルの各レコードにフィルタを効率的に適用することで、整数列に対して改善されました。
-
Iceberg – 2GB を超える Iceberg Parquet ファイルを書き込むときにエラーが発生する問題を修正しました。
-
非圧縮出力 – CREATE TABLE ステートメントが、非圧縮ファイルの書き込みをサポートするようになりました。非圧縮ファイルを書き込むには、次の構文を使用します。
-
CREATE TABLE (テキストファイルまたは JSON) –
TBLPROPERTIES
で、write.compression = NONE
を指定します。 -
CREATE TABLE (Parquet) –
TBLPROPERTIES
で、parquet.compression = UNCOMPRESSED
を指定します。 -
CREATE TABLE (ORC) –
TBLPROPERTIES
で、orc.compress = NONE
を指定します。
-
-
圧縮 – あるフォーマットで圧縮されたファイルを作成したが、デフォルト以外の圧縮方法を使用したときに、別の圧縮形式のファイル拡張子を使用したテキストファイルテーブルの挿入に関する問題を修正しました。
-
Avro – Avro ファイルから固定タイプの小数点を読み込むときに発生する問題を修正しました。
2022 年 3 月 2 日
公開日: 2022 年 3 月 2 日
Athena は、次の機能と改善点を発表しました。
-
クエリ結果の場所バケットで ACL が有効になっている場合、クエリ結果に対するフルコントロールアクセスを Simple Storage Service (Amazon S3) バケット所有者に付与できるようになりました。詳細については、「クエリ結果の場所を指定する」を参照してください。
-
既存の名前付きクエリを更新できるようになりました。詳細については、「保存されたクエリを使用する」を参照してください。
2022 年 2 月 23 日
公開日: 2022 年 2 月 23 日
Athena は、次の修正とパフォーマンス改善を発表しました。
-
パフォーマンスを向上させ、メモリエラーを削減するためのメモリ処理の改善。
-
Athena は、ストライプフッターに保存されたタイムゾーン情報で ORC タイムスタンプ列を読み込み、タイムゾーン (UTC) を持つ ORC ファイルをフッターに書き込むようになりました。これは、読み込む ORC ファイルが UTC 以外のタイムゾーン環境で作成された場合にのみ、ORC タイムスタンプ読み込みの動作に影響します。
-
十分最適でないクエリプランが発生するシンボリック リンクテーブルサイズの誤見積もりを修正しました。
-
水平分解ビューを Hive メタストア データソースから Athena コンソールでクエリできるようになりました。
-
Amazon S3 の読み込みエラーメッセージが改善され、より詳細な Simple Storage Service (Amazon S3) のエラーコード情報が含まれるようになりました。
-
ORC 形式の出力ファイルで Apache Hive 3.1 との互換性がなくなる問題を修正しました。
-
一部の DML および DDL クエリで、引用符付きのテーブル名が失敗する問題を修正しました。
2022 年 2 月 15 日
公開日: 2022 年 2 月 15 日
Amazon Athena はアクティブな DML クエリクォータをすべての AWS リージョンで増加させました。アクティブなクエリには、実行中のクエリとキューに登録されたクエリの両方が含まれます。この変更により、これまでよりも多くの DML クエリをアクティブ状態にできるようになりました。
Athena のサービスクォータの詳細については、「Service Quotas」を参照してください。Athena を使用するリージョンのクエリクォータについては、「AWS 全般のリファレンス」の「 Amazon Athena エンドポイントとクォータ」を参照してください。
クォータの使用状況をモニタリングするには、CloudWatch の使用状況メトリクスを使用できます。Athena は、AWS/Usage
名前空間に ActiveQueryCount
メトリクスを公開します。詳細については、「CloudWatch による Athena 使用状況メトリクスのモニタリング」を参照してください。
使用状況を確認したら、Service Quotas
2022 年 2 月 14 日
公開日: 2022 年 2 月 14 日
このリリースでは、Athena GetQueryExecution API アクションの AthenaError レスポンスオブジェクトに ErrorType
サブフィールドが追加されました。
既存の ErrorCategory
フィールドは、失敗したクエリの一般的なソース (システム、ユーザー、またはその他) を示しますが、新しい ErrorType
フィールドには、発生したエラーに関するより詳細な情報が表示されます。両方のフィールドの情報を組み合わせて、クエリが失敗した原因に関するインサイトを把握します。
詳細については、「Athena エラーカタログ」を参照してください。
2022 年 2 月 9 日
公開日: 2022 年 2 月 9 日
古い Athena コンソールは利用できなくなりました。Athena の新しいコンソールは、以前のコンソールの機能をすべてサポートしています。それでいて使いやすく、最新のインターフェースを備えており、新機能によりクエリの開発、データの分析、使用状況管理の経験が向上します。新しい Athena コンソールを使用するには、https://console.aws.amazon.com/athena
2022 年 2 月 8 日
公開日: 2022 年 2 月 8 日
バケット所有者 — 追加のセキュリティ対策として、クエリ結果を出力する場所となる Athena のバケットの、所有者 AWS アカウント の ID を、オプションで指定できるようになりました。クエリ結果でのバケット所有者のアカウント ID が、ここで指定したアカウント ID と一致しない場合、Amazon S3 のアクセス許可エラーにより、バケットに出力できません。この設定は、クライアントレベルまたはワークグループレベルで行えます。
詳細については、「クエリ結果の場所を指定する」を参照してください。
2022 年 1 月 28 日
公開日: 2022 年 1 月 28 日
Athena では、次のエンジン機能の強化点を発表しました。
-
Apache Hudi — Hudi Merge on Read (MoR) テーブルに対するスナップショットクエリで、
INT64
データ型のタイムスタンプ列の読み込みが可能になりました。 -
UNION クエリ — パフォーマンスが向上し、同じテーブルを何度もスキャンするような特定の
UNION
クエリの、データスキャンを減らしました。 -
クエリの分離 — フィルターの各パーティション列に対して、分離値のみを含むクエリの、パフォーマンスが向上しました。
-
パーティション射影の強化
-
injected
タイプの列に対するフィルター条件として、複数の分離値が許可されるようになりました。詳細については、「挿入型」を参照してください。 -
分離値のみがフィルターに含まれ、
CHAR
やVARCHAR
のような文字をベースとしたタイプの列の、パフォーマンスが向上しました。
-
2022 年 1 月 13 日
公開日: 2022 年 1 月 13 日
Athena 用の JDBC 2.0.27 ドライバー と ODBC 1.1.15 ドライバー がリリースされました。
JDBC 2.0.27 ドライバーには、次の変更が含まれています。
-
外部カタログを取得するようにドライバが更新されました。
-
拡張ドライバのバージョン番号は、Athena API コールの一部として、
user-agent
文字列に含まれます。
ODBC 1.1.15 ドライバーには、次の変更が含まれています。
-
SQLParamData()
への 2 回目の呼び出しに関する問題を修正しました。
これらの変更についての詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」および「ODBC で Amazon Athena に接続する」を参照してください。
Athena リリースノート (2021 年)
2021 年 11 月 26 日
公開日: 2021 年 11 月 26 日
Athena は、Athena ACIDトランザクションのパブリックプレビューを発表しました。Athena の SQL データ操作言語 (DML) に書込み、削除、更新、およびタイムトラベルの操作を追加しました。Athena ACID トランザクションにより、複数のユーザーが、Amazon S3 データに対して信頼性の高い行レベルの変更を、同時に行えます。Apache Iceberg
使い慣れた SQL 構文で Athena ACID トランザクションを行うことで、ビジネスや規制に関するデータの更新が簡素化されます。たとえば、データの消去リクエストに応答する場合は、SQL の DELETE
オペレーションを実行します。手動によるレコードの修正には、単一の UPDATE
ステートメントを使用します。また、最近削除されたデータを回復する場合は、SELECT
ステートメントにより、タイムトラベルクエリを発行します。Athena コンソール、API オペレーション、ODBC および JDBC ドライバー経由で、Athena のトランザクションを利用できます。
詳細については、「Athena ACID トランザクションを使用する」を参照してください。
2021 年 11 月 24 日
公開日: 2021 年 11 月 24 日
Athena は、ZStandard
Athena でのデータ圧縮の詳細については、「Athena で圧縮を使用する」を参照してください。
2021 年 11 月 22 日
公開日: 2021 年 11 月 22 日
これで Amazon Athena コンソールから AWS Step Functions ワークフローを管理する際に、スケーラブルなデータを処理するパイプラインの構築、カスタムのビジネスロジックに基づくクエリの実行、管理タスクやアラートタスクの自動化などが容易になります。
アップグレードされた Athena コンソール に Step Functions が統合され、これにより Athena を起動するステートマシンのインタラクティブなワークフロー図を表示できます。開始するには、左のナビゲーションパネルから [Workflows] (ワークフロー) を選択します。Athena クエリを持つ既存のステートマシンがある場合は、ステートマシンを選択して、インタラクティブなワークフロー図を表示します。Step Functions を初めて使用する場合は、まず Athena コンソールからサンプルプロジェクトを起動し、ユースケースに合わせてカスタマイズします。
詳細については、Amazon Athena と「AWS Step Functions を使用して ETL パイプラインの構築とオーケストレーションを行う
2021 年 11 月 18 日
公開日: 2021 年 11 月 18 日
Athena は、新機能と改善点を発表しました。
-
次の例で示すような、
DISTINCT
かORDER BY
、またその両方を含む集計クエリの、ディスクへのスピルをサポートします。SELECT array_agg(orderstatus ORDER BY orderstatus) FROM orders GROUP BY orderpriority, custkey
-
DISTINCT
を使用するクエリの、メモリ処理に関する問題を修正しました。DISTINCT
クエリを使用した際に、「Query exhausted resources at this scale factor
」(このスケールファクターにより、クエリがリソースを使い果たしました) のようなメッセージが表示されないようにするには、DISTINCT
のカーディナリティが低い行を選択するか、クエリのデータサイズを減らします。 -
特定の列を指定しない
SELECT COUNT(*)
クエリで、行バッファリングなしでカウントのみを保持することで、パフォーマンスとメモリ使用率が向上しました。 -
次の文字列関数が導入されました。
-
translate(source, from, to)
—from
の文字列を、対応するto
の文字列に置き換えた、source
文字列を返します。from
の文字列が重複していた場合、最初の文字列だけが使用されます。from
文字列の中にsource
の文字が無い場合、source
の文字は翻訳されずにコピーされます。from
文字列にあるマッチした文字のインデックスが、to
文字列よりも長い場合、その文字は結果として返される文字列から省かれます。 -
concat_ws(string0, array(varchar))
—string0
を区切り文字として使用して、配列の要素を連結し、その結果を返します。string0
が null である場合、戻り値は null です。配列内の null 値はスキップされます。
-
-
欠落している
struct
のサブフィールドにアクセスしようとすると、クエリが失敗してしまうバグを修正しました。欠落しているサブフィールドについては、クエリが null を返すようになりました。 -
小数データ型のハッシュが矛盾する問題を修正しました。
-
パーティション内の列が多すぎると、リソースを使い果たしてしまう問題を修正しました。
2021 年 11 月 17 日
公開日: 2021 年 11 月 17 日
Amazon Athena
パーティション化されたテーブルをクエリする場合、Athena が利用可能なテーブルパーティションを取得し、クエリに関係のあるサブセットをフィルタリングします。新しいデータとパーティションが追加されると、パーティションの処理にかかる時間が長くなり、クエリランタイムも長くなります。Athena がAWS Glue パーティションインデックスをサポートし、パーティション処理が最適化され、高度にパーティション化されたテーブルでのクエリパフォーマンスが向上しました。
詳細については、「AWS Glue パーティションのインデックス作成とフィルタリングでクエリを最適化する」を参照してください。
2021 年 11 月 16 日
公開日: 2021 年 11 月 16 日
新しくなって改善された Amazon Athena
-
クエリタブバーが再設計され、複数のクエリタブを並べ替え、移動し、閉じることが可能になりました。
-
SQL およびテキストの書式設定が改善され、クエリの読み込みと編集がより簡単になりました。
-
完全な結果セットのダウンロードに加え、クエリ結果をクリップボードにコピーできるようになりました。
-
クエリ履歴、保存されたクエリ、ワークグループを並べ替え、表示または非表示にする列を選択できるようになりました。
-
シンプルなインターフェイスのおかげで、データソースとワークグループをより少ないクリック数で設定できます。
-
クエリ結果、クエリ履歴、行の折り返しなどの表示に関するプリファレンスを設定できます。
-
キーボードショートカットが新しく改善され、また製品ドキュメントが組み込まれたことにより、生産性を向上できます。
本日の発表で、再設計されたコンソール
必要な場合は、AWS アカウント にログインし、Amazon Athena を選択してから、左のナビゲーションパネルにある [New Athena experience] (新しい Athena エクスペリエンス) の選択を解除すると、以前のコンソールを使用できます。
2021 年 11 月 12 日
公開日: 2021 年 11 月 12 日
Amazon Athena を使用して、自分以外の AWS アカウントにあるデータソースに対し、フェデレーティッドクエリを実行できるようになりました。今日までは、このデータをクエリして、データをクエリしたユーザーと同じ AWS アカウント を使用するには、データソースとそのコネクタが必要でした。
データ管理者としては、データコネクタをデータアナリストのアカウントと共有することで、クロスアカウントのフェデレーティッドクエリを有効にできます。データアナリストとしては、データ管理者が共有してくれたデータコネクタをアカウントに追加できます。発信元アカウントのコネクタに対する設定変更は、共有されたコネクタに自動的に適用されます。
クロスアカウントフェデレーティッドクエリの有効化については、「クロスアカウントフェデレーテッドクエリを有効にする」を参照してください。フェデレーティッドソースに対するクエリについては、「Amazon Athena 横串検索を使用する」および「フェデレーティッドクエリを使用する」を参照してください。
2021 年 11 月 2 日
公開日: 2021 年 11 月 2 日
Athena で EXPLAIN ANALYZE
ステートメントを使用して、SQL クエリで分散された実行プランと、それぞれのオペレーションコストを表示できるようになりました。
詳細については、「Athena での EXPLAIN および EXPLAIN ANALYZE の使用」を参照してください。
2021 年 10 月 29 日
公開日: 2021 年 10 月 29 日
Athena が JDBC 2.0.25 ドライバーと ODBC 1.1.13 ドライバーをリリースし、それぞれの機能と改善点を発表します。
JDBC ドライバーおよび ODBC ドライバー
Athena 用の JDBC 2.0.25 ドライバーと ODBC 1.1.13 ドライバーがリリースされました。どちらのドライバーも、任意の SAML 2.0 プロバイダで動作するように構成可能な、ブラウザでの SAML 多要素認証をサポートしています。
JDBC 2.0.25 ドライバーには、次の変更が含まれています。
-
ブラウザでの SAML 認証をサポート。ドライバーには、任意の SAML 2.0 プロバイダーで動作するように構成可能な、ブラウザの SAML プラグインが含まれています。
-
AWS Glue API コールのサポート。
GlueEndpointOverride
パラメータを使用して、AWS Glue エンドポイントをオーバーライドできます。 -
com.simba.athena.amazonaws
クラスパスを、com.amazonaws
に変更しました。
ODBC 1.1.13 ドライバーには、次の変更が含まれています。
-
ブラウザでの SAML 認証をサポート。ドライバーには、任意の SAML 2.0 プロバイダーで動作するように構成可能な、ブラウザの SAML プラグインが含まれています。ODBC ドライバーでブラウザの SAML プラグインを使用する例については、「ODBC、SAML 2.0、Okta Identity Provider を使用してシングルサインオンを設定する」を参照してください。
-
ADFS、Azure AD、または Browser Azure AD を認証に使用するときに、ロールのセッション期間を設定できるようになりました。
この詳細や、その他の変更について確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」および「ODBC で Amazon Athena に接続する」を参照してください。
特徴と改善点
Athena は、次の機能と改善点を発表しました。
-
特定のケースにおいて、テーブルスキャンが重複して行われることを回避するために、新しい最適化ルールが導入されました。
2021 年 10 月 4 日
公開日: 2021 年 10 月 4 日
Athena は、次の機能と改善点を発表しました。
-
SQL OFFSET — SQLの
SELECT
ステートメントで、OFFSET
句がサポートされるようになりました。詳細については、「SELECT」を参照してください。 -
CloudWatch の使用状況メトリクス — Athena が
AWS/Usage
名前空間で、ActiveQueryCount
メトリクスを発行するようになりました。詳細については、「CloudWatch による Athena 使用状況メトリクスのモニタリング」を参照してください。 -
クエリ実行計画 — まれに、クエリ実行計画でタイムアウトを引き起こす可能性のあるバグを修正しました。
2021 年 9 月 16 日
公開日: 2021 年 9 月 16 日
Athena は、次の新機能と改善点を発表しました。
機能
-
CTAS において、テキストファイルの指定と、
write_compression
テーブルプロパティを使用した圧縮 JSON の指定をサポートしました。Parquet 形式および ORC 形式の場合でも、CTAS でwrite_compression
プロパティを指定できます。詳細については、「CTAS テーブルのプロパティ」を参照してください。 -
テキストファイルと JSON ファイルへの書き込みで、BZIP2 圧縮形式がサポートされました。Athena での圧縮形式の詳細については、「Athena で圧縮を使用する」を参照してください。
改良点
-
UDF の Lambda 関数への ID 情報送信が、失敗してしまうバグを修正しました。
-
分離フィルター条件での、述語プッシュダウンの問題を修正しました。
-
小数型のハッシュの問題を修正しました。
-
不要な統計を収集していた問題を修正しました。
-
一貫性のないエラーメッセージを削除しました。
-
ワーカーノードで動的パーティションプルーニングを適用し、ブロードキャストジョインのパフォーマンスが向上しました。
-
フェデレーティッドクエリ
-
フェデレーティッドクエリ内で
CONSTRAINT_VIOLATION
エラーの発生を削減するために設定を変更しました。
-
2021 年 9 月 15 日
公開日: 2021 年 9 月 15 日
再設計された Amazon Athena コンソール (プレビュー) を使用できるようになりました。新しい Athena JDBC ドライバーがリリースされました。
Athena コンソールのプレビュー
Athena が利用可能であれば、どの AWS リージョン からでも再設計された Amazon Athena
新しいコンソール
新しいコンソール
Athena JDBC ドライバー 2.0.24
Athena は、Athena 用 JDBC ドライバーのバージョン 2.0.24 の利用開始を発表しました。このリリースでは、すべての認証情報プロバイダのプロキシサポートが更新されます。ドライバーは、NonProxyHosts
接続プロパティでサポートされていない、すべてのホストのプロキシ認証をサポートするようになりました。
便宜上、このリリースには、AWS SDK が付属したJDBC ドライバーと、付属しないドライバーの両方のダウンロードが含まれています。この JDBC ドライバーのバージョンには、AWS-SDK と Athena JDBC ドライバーの両方がプロジェクトに埋め込まれています。
詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。
2021 年 8 月 31 日
公開日: 2021 年 8 月 31 日
Athena では、次の機能強化とバグ修正が行われました。
-
Athena フェデレーション機能の強化 — Athena は、Athena Query Federation SDK
の一部として、マッピングタイプのサポートと、複合型に対するサポートを強化しました。このバージョンには、メモリの強化とパフォーマンスの最適化も含まれています。 -
新しいエラーカテゴリ — エラーメッセージに、
USER
とSYSTEM
のエラーカテゴリが導入されました。これらのカテゴリは、自分で修正が可能なエラー (USER
) なのか、Athena サポートから支援を受ける必要があるエラー (SYSTEM
) なのかを区別するのに役立ちます。 -
フェデレーティッドクエリのエラーメッセージ — フェデレーティッドクエリ関連エラーで、
USER_ERROR
のカテゴリー分けを更新しました。 -
JOIN — ディスクへのスピル関連のバグとメモリの問題を修正し、
JOIN
オペレーションにおけるパフォーマンスを向上させ、メモリエラーを減らします。
2021 年 8 月 12 日
公開日: 2021 年 8 月 12 日
Athena 用の ODBC 1.1.12 ドライバーがリリースされました。このバージョンでは、SQLPrepare()
、SQLGetInfo()
、および EndpointOverride
関連の問題が修正されています。
新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「ODBC で Amazon Athena に接続する」を参照してください。
2021 年 8 月 6 日
公開日: 2021 年 8 月 6 日
Amazon Athena では、アジアパシフィック (大阪) リージョンで Athena とその機能
このリリースでは、アジアパシフィックでの Athena の提供が拡張され、アジアパシフィック (香港)、アジアパシフィック (ムンバイ)、アジアパシフィック (大阪)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、およびアジアパシフィック (東京) も含まれるようになりました。これらのリージョンや他のリージョンで利用可能な AWS のサービス の詳細な一覧については、「AWS リージョン 別のサービス表
2021 年 8 月 5 日
公開日: 2021 年 8 月 5 日
UNLOAD
ステートメントを使用して、SELECT
クエリの出力を PARQUET、ORC、AVRO、および JSON 形式に書き込めます。
詳細については、「UNLOAD」を参照してください。
2021 年 7 月 30 日
公開日: 2021 年 7 月 30 日
Athena では、次の機能強化とバグ修正が行われました。
-
動的フィルタリングとパーティションプルーニング - 次の例のように、これらの改善によってパフォーマンスが向上し、特定のクエリでスキャンされるデータ量が削減します。
この例では、
Table_B
がパーティション化されていないテーブルで、ファイルサイズが 20 MB 未満であると想定しています。このようなクエリの場合、Table_A
から読み込まれるデータがより少なくなり、クエリがより迅速に完了します。SELECT * FROM Table_A JOIN Table_B ON Table_A.date = Table_B.date WHERE Table_B.column_A = "value"
-
ORDER BY と LIMIT、DISTINCT と LIMIT -
ORDER BY
またはDISTINCT
に続いてLIMIT
句を使用するクエリのパフォーマンスが改善されました。 -
S3 Glacier Deep Archive ファイル - Athena が S3 Glacier Deep Archive ファイルと S3 Glacier 以外のファイルが混在するテーブルをクエリする場合、S3 Glacier Deep Archive ファイルをスキップするようになりました。以前は、これらのファイルをクエリの場所から手動で移動する必要がありました。これを行わないと、クエリが失敗します。Athena を使用して S3 Glacier Deep Archive ストレージ内のオブジェクトをクエリする場合は、それらを元に戻す必要があります。詳細については、「Amazon S3 ユーザーガイド」の「アーカイブされたオブジェクトの復元」を参照してください。
-
CTAS
bucketed_by
テーブルプロパティによって作成された空のファイルが正しく暗号化されなかったバグを修正しました。
2021 年 7 月 21 日
公開日: 2021 年 7 月 21 日
2021 年 7 月にリリースされた Microsoft Power BI Desktop
コネクタは、既存の ODBC データソース名 (DSN) を使用して Athena に接続してクエリを実行するため、Athena ODBC ドライバーが必要です。最新の ODBC ドライバーをダウンロードする方法は、「ODBC で Amazon Athena に接続する」を参照してください。
詳細については、「Amazon Athena Power BI コネクタを使用する」を参照してください。
2021 年 7 月 16 日
公開日: 2021 年 7 月 16 日
Amazon Athena の Apache Hudi との統合を更新しました。Hudi は、Amazon S3 データレイクの増分データ処理を簡素化するのに使用されるオープンソースのデータ管理フレームワークです。統合を更新することにより、Amazon EMR、Apache Spark、Apache Hive、またはその他の互換性のあるサービスで管理される Hudi 0.8.0 テーブルを、Athena を使用してクエリできます。さらに、Athena は、読み込み時マージ (MoR) テーブルのスナップショットクエリと、ブートストラップされたテーブルの読み込みサポートの 2 つの追加機能をサポートするようになりました。
Apache Hudi は、変更データキャプチャ (CDC) パイプラインの開発の簡素化、GDPR 駆動の更新と削除への準拠、およびデータの挿入とイベントの更新を必要とするセンサーやデバイスからのストリーミングデータの管理に役立つレコードレベルのデータ処理を提供します。0.8.0 リリースでは、データをコピーせずに、大きな Parquet テーブルを Hudi に移行しやすくなり、Athena を介してクエリおよび分析できるようになります。Athena の新しいスナップショットクエリのサポートを使用して、ストリーミングテーブルの更新をほぼリアルタイムで表示できます。
Athena での Hudi の使用の詳細については、「Apache Hudi データセットをクエリする」を参照してください。
2021 年 7 月 8 日
公開日: 2021 年 7 月 8 日
Athena 用の ODBC 1.1.11 ドライバーがリリースされました。ODBC ドライバーが JSON ウェブトークン (JWT) を使用して接続を認証できるようになりました。Linux では、Workgroup プロパティのデフォルト値は Primary に設定されています。
詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「ODBC で Amazon Athena に接続する」を参照してください。
2021 年 7 月 1 日
公開日: 2021 年 7 月 1 日
2021年7月1日、プレビューワークグループの特別な取り扱いが終了しました。AmazonAthenaPreviewFunctionality
ワークグループの名前は保持されますが、特別なステータスはなくなります。引き続き AmazonAthenaPreviewFunctionality
ワークグループを使用して、クエリを表示、変更、整理、実行できます。ただし、以前プレビューに含まれていた機能を使用するクエリには、標準の Athena 請求条件が適用されます。請求については、「Amazon Athena の料金
2021 年 6 月 23 日
公開日: 2021 年 6 月 23 日
Athena 用の JDBC 2.0.23 ドライバー と ODBC 1.1.10 ドライバー がリリースされました。どちらのドライバーも、読み込み性能とサポートが向上し、EXPLAIN ステートメントおよびパラメータ化されたクエリをサポートしています。
EXPLAIN
ステートメントは、SQL クエリの論理実行計画または分散実行計画を示します。パラメータ化されたクエリを使用すると、実行時に指定された異なる値を使用して、同じクエリを複数回使用できます。
JDBC リリースでは、アクティブディレクトリフェデレーションサービス 2019 のサポートと、AWS STS 用のカスタムエンドポイント優先オプションが追加されています。ODBC リリースでは、IAM プロファイル認証情報の問題を修正しています。
詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」および「ODBC で Amazon Athena に接続する」を参照してください。
2021 年 5 月 12 日
公開日: 2021 年 5 月 12 日
Amazon Athena を使用して、所有するアカウント以外のアカウントから AWS Glue を登録できるようになりました。AWS Glue に必要な IAM アクセス許可を設定したら、Athena を使用してクロスアカウントクエリを実行できます。
詳細については、別のアカウントからデータカタログを登録するおよびAWS Glue データカタログへのクロスアカウントアクセスを構成するを参照してください。
2021 年 5 月 10 日
公開日: 2021 年 5 月 10 日
Athena 用の ODBC ドライバーバージョン1.1.9.1001 がリリースされました。このバージョンでは、Azure Active Directory (AD) を使用した際に発生する BrowserAzureAD
認証タイプの問題を修正しています。
新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「ODBC で Amazon Athena に接続する」を参照してください。
2021 年 5 月 5 日
公開日: 2021 年 5 月 5 日
横串検索で Amazon Athena Vertica コネクタを使用して、Athena から Vertica データソースをクエリできるようになりました。例えば、Vertica 上のデータウェアハウス、および Amazon S3 内のデータレイクに対して分析クエリを実行できます。
Athena Vertica コネクタをデプロイするには、AWS Serverless Application Repository の「AthenaVerticaConnector
Amazon Athena Vertica コネクタは、Lambda 環境変数を使用して、いくつかの設定オプションを公開します。設定オプション、パラメータ、接続文字列、デプロイ、および制限事項については、「Amazon Athena Vertica コネクタ」を参照してください。
Vertica コネクタの使用に関する詳細については、「AWS ビッグデータブログ」の「Athena 横串検索 SDK を使用して Amazon Athena で Vertica データソースをクエリする
2021 年 4 月 30 日
公開日: 2021 年 4 月 30 日
Athena 用の JDBC ドライバー 2.0.21 と ODBC ドライバー 1.1.9 がリリースされました。両方のリリースで、Azure Active Directory (AD) での SAML 認証と、PingFederate での SAML 認証がサポートされています。JDBC リリースでは、パラメータ化されたクエリもサポートされています。Athena でのパラメータ化されたクエリの詳細については、「パラメータ化されたクエリを使用する」を参照してください。
新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」および「ODBC で Amazon Athena に接続する」を参照してください。
2021 年 4 月 29 日
公開日: 2021 年 4 月 29 日
Amazon Athena が、中国 (北京) および中国 (寧夏) リージョンでの Athena エンジンバージョン 2 の提供開始を発表しました。
Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。
2021 年 4 月 26 日
公開日: 2021 年 4 月 26 日
Athena エンジンバージョン 2 のウィンドウ値関数が IGNORE NULLS
と RESPECT NULLS
をサポートするようになりました。
詳細については、Presto ドキュメントの「Value Functions
2021 年 4 月 21 日
公開日: 2021 年 4 月 21 日
Amazon Athena が欧州 (ミラノ) およびアフリカ (ケープタウン) リージョンでの Athena エンジンバージョン 2 の提供開始を発表しました。
Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。
2021 年 4 月 5 日
公開日: 2021 年 4 月 5 日
EXPLAIN ステートメント
Athena で EXPLAIN
ステートメントを使用して、SQL クエリの実行プランを表示できるようになりました。
詳細については、Athena での EXPLAIN および EXPLAIN ANALYZE の使用およびAthena EXPLAIN ステートメントの結果を理解するを参照してください。
SQL クエリでの SageMaker 機械学習モデル
Amazon SageMaker を使用した機械学習モデル推論が、Amazon Athena で一般公開されました。SQL クエリで機械学習モデルを使用して、SQL クエリで関数を呼び出すことによる異常検知、カスタマーコーホート分析、および時系列予測などの複合型のタスクを簡素化します。
詳細については、「Amazon Athena で機械学習 (ML) を使用する」を参照してください。
ユーザー定義関数 (UDF)
ユーザー定義関数 (UDF) が Athena で一般公開されました。UDF を使用して、単一の SQL クエリでレコードまたはレコードのグループを処理するカスタム関数を活用します。
詳細については、「ユーザー定義関数を使用してクエリする」を参照してください。
2021 年 3 月 30 日
公開日: 2021 年 3 月 30 日
Amazon Athena が、アジアパシフィック (香港) および中東 (バーレーン) リージョンでの Athena エンジンバージョン 2 の提供開始を発表しました。
Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。
2021 年 3 月 25 日
公開日: 2021 年 3 月 25 日
Amazon Athena が、ヨーロッパ (ストックホルム) リージョンでの Athena エンジンバージョン 2 の提供開始を発表しました。
Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。
2021 年 3 月 5 日
公開日: 2021 年 3 月 5 日
Amazon Athena が、カナダ (中部)、欧州 (フランクフルト)、および南米 (サンパウロ) の各リージョンでの Athena エンジンバージョン 2 の提供開始を発表しました。
Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。
2021 年 2 月 25 日
公開日: 2021 年 2 月 25 日
Amazon Athena が、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、欧州 (ロンドン)、および欧州 (パリ) の各リージョンでの Athena エンジンバージョン 2 の一般提供開始を発表しました。
Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。
Athena リリースノート (2020 年)
2020 年 12 月 16 日
公開日: 2020 年 12 月 16 日
Amazon Athena が、他のリージョンで Athena エンジンバージョン 2、Athena Federated Query、および AWS PrivateLink を提供することを発表しました。
Athena エンジンバージョン 2 と Athena 横串検索
Amazon Athena が、アジアパシフィック (ムンバイ)、アジアパシフィック (東京)、欧州 (アイルランド)、および米国西部 (北カリフォルニア) の各リージョンでの Athena エンジンバージョン 2 および Athena 横串検索の一般提供開始を発表しました。Athena エンジンバージョン 2 と横串検索は、すでに米国東部 (バージニア北部)、米国東部 (オハイオ)、および米国西部 (オレゴン) の各リージョンで利用可能です。
詳細については、Athena エンジンバージョン 2およびAmazon Athena 横串検索を使用するを参照してください。
AWS PrivateLink
欧州 (ストックホルム) リージョンで Athena の AWS PrivateLink がサポートされるようになりました。Athena の AWS PrivateLink については、「インターフェイス VPC エンドポイントを使用して Amazon Athena に接続する」を参照してください。
2020 年 11 月 24 日
公開日: 2020 年 11 月 24 日
Athena 用の JDBC ドライバー 2.0.16 と ODBC ドライバー 1.1.6 がリリースされました。これらのリリースでは、Okta Verify 多要素認証 (MFA) をアカウントレベルでサポートします。また、Okta MFA を使用して SMS 認証と Google 認証システムの認証を要素として設定することもできます。
新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」および「ODBC で Amazon Athena に接続する」を参照してください。
2020 年 11 月 11 日
公開日: 2020 年 11 月 11 日
Amazon Athena が、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国東部 (オハイオ)、および米国西部 (オレゴン) の各リージョンでの Athena エンジンバージョン 2 および横串検索の一般提供開始を発表しました。
Athena エンジンバージョン 2
Amazon Athena が、新しいクエリエンジンバージョンである Athena エンジンバージョン 2 の米国東部 (バージニア北部)、米国東部 (オハイオ)、および米国西部 (オレゴン) の各リージョンでの一般提供開始を発表しました。
Athena エンジンバージョン 2 には、Parquet 形式のデータに対するスキーマ進化のサポート、追加の地理空間関数、ネストされたスキーマの読み込みによるコスト削減のサポート、および JOIN と AGGATE オペレーションにおけるパフォーマンス強化などのパフォーマンス面での改善と新しい機能が含まれています。
-
改善点、最新の変更、およびバグ修正については、「Athena エンジンバージョン 2」を参照してください。
-
更新方法については、「Athena エンジンバージョンを変更する」を参照してください。
-
クエリのテストについては、「エンジンバージョンをアップグレードする前にクエリをテストする」を参照してください。
フェデレーティッド SQL クエリ
米国東部 (バージニア北部)、米国東部 (オハイオ)、および米国西部 (オレゴン) の各リージョンで、AmazonAthenaPreviewFunctionality
ワークグループを使用することなく Athena のフェデレーティッドクエリを利用できるようになりました。
フェデレーティッド SQL クエリを使用して、リレーショナル、非リレーショナル、オブジェクト、カスタムの各データソース間で SQL クエリを実行します。横串検索を使用すると、ユーザーは単一の SQL クエリを送信することで、オンプレミスで実行されているか、クラウド内でホストされている複数のソースのデータをスキャンできます。
複数のアプリケーションに分散されたデータに対する分析の実行は、以下の理由により、複合型で時間がかかる場合があります。
-
分析に必要なデータは、通常、リレーショナル、キーバリュー、ドキュメント、インメモリ、検索、グラフ、オブジェクト、時系列、および台帳の各データストアに分散されています。
-
これらのソース間のデータを分析するために、分析では複合型のパイプラインを構築してデータを抽出、変換し、データウェアハウスにロードすることで、データにクエリを実行できるようにします。
-
さまざまなソースのデータにアクセスするには、新しいプログラミング言語とデータアクセスコンストラクトを学習する必要があります。
Athena のフェデレーティッド SQL クエリは、データの保管場所にかかわらず、ユーザーがインプレースでデータをクエリできるようにすることで、このような複合型を排除します。アナリストは、使い慣れた SQL コンストラクトを使用して複数のデータソース間でデータを JOIN
してすばやく分析し、後で使用できるようにその結果を Simple Storage Service (Amazon S3) に保存できます。
データソースコネクタ
横串検索を処理するために、Athena は AWS Lambda
カスタムデータソースコネクタ
Athena Query Federation SDK
次のステップ
-
フェデレーティッドクエリ機能の詳細については、「Amazon Athena 横串検索を使用する」を参照してください。
-
既存のコネクタの使用を開始するには、「コネクタのデプロイとデータソースへの接続」を参照してください。
-
Athena Query Federation SDK を使用して独自のデータソースコネクタを構築する方法については、GitHub の「Example Athena Connector
」を参照してください。
2020 年 10 月 22 日
公開日: 2020 年 10 月 22 日
これで AWS Step Functions で Athena を呼び出せます。AWS Step Functions は、Amazon States Language を直接使用して特定の AWS のサービス を制御できます。Step Functions を Athena で使用して、クエリの実行の開始と停止、クエリ結果の取得、アドホックまたはスケジュールされたデータクエリの実行、Simple Storage Service (Amazon S3) 内のデータレイクからの結果の取得を行うことができます。
詳細については、「AWS Step Functions デベロッパーガイド」の「Step Functions で Athena を呼び出す」を参照してください。
2020 年 7 月 29 日
公開日: 2020 年 7 月 29 日
JDBC ドライバーバージョン 2.0.13 がリリースされました。このリリースは、Athena に登録された複数のデータカタログ、認証のための Okta サービス、および VPC エンドポイントへの接続の使用をサポートします。
新しいバージョンのドライバーをダウンロードして使用するには、「JDBC で Amazon Athena に接続する」を参照してください。
2020 年 7 月 9 日
公開日: 2020 年 7 月 9 日
Amazon Athena が、圧縮された Hudi データセットのクエリに対するサポートと、Athena に登録するデータカタログを作成、更新、または削除するための AWS CloudFormation の AWS::Athena::DataCatalog
リソースを追加しました。
Apache Hudi データセットのクエリ
Apache Hudi は、増分データ処理を簡素化するオープンソースのデータ管理フレームワークです。Amazon Athena が、Amazon S3 ベースのデータレイク内にある Apache Hudi データセットの読み込み最適化ビューのクエリをサポートするようになりました。
詳細については、「Apache Hudi データセットをクエリする」を参照してください。
AWS CloudFormation データカタログのリソース
Amazon Athena の横串検索機能を使用してデータソースをクエリするには、まずデータカタログを Athena に登録する必要があります。AWS CloudFormation の AWS::Athena::DataCatalog
リソースを使用して、Athena に登録するデータカタログを作成、更新、または削除できるようになりました。
詳細については、「AWS CloudFormation ユーザーガイド」の「AWS::Athena::DataCatalog」を参照してください。
2020 年 6 月 1 日
公開日: 2020 年 6 月 1 日
Amazon Athena での Apache Hive メタストアのメタカタログとしての使用
Athena での AWS Glue Data Catalog に加えて、Athena を 1 つ以上の Apache Hive メタストアに接続できるようになりました。
自己ホスト型の Hive メタストアに接続するには、Athena Hive メタストアコネクタが必要です。Athena は、これに使用できるリファレンス実装コネクタを提供します。コネクタは、ユーザーのアカウントで AWS Lambda 関数として動作します。
詳細については、「外部の Hive メタストアを使用する」を参照してください。
2020 年 5 月 21 日
公開日: 2020 年 5 月 21 日
Amazon Athena がパーティション射影のサポートを追加しました。パーティション射影を使用して、高度にパーティションされたテーブルのクエリ処理を高速化し、パーティション管理を自動化します。詳細については、「Amazon Athena でパーティション射影を使用する」を参照してください。
2020 年 4 月 1 日
公開日: 2020 年 4 月 1 日
米国東部 (バージニア北部) リージョンに加えて、アジアパシフィック (ムンバイ)、欧州 (アイルランド)、および米国西部 (オレゴン) の各リージョンでも Amazon Athena のフェデレーティッドクエリ、ユーザー定義関数 (UDF)、機械学習推論、および外部 Hive メタストア機能をプレビューできるようになりました。
2020 年 3 月 11 日
公開日: 2020 年 3 月 11 日
Amazon Athena が、クエリの状態推移に関する Amazon EventBridge イベントをパブリッシュするようになりました。クエリの状態が推移 (例えば、「成功」または「キャンセル済」など、「実行中」から最終状態に推移) すると、Athena はクエリ状態変更イベントを EventBridge にパブリッシュします。イベントには、クエリ状態移行に関する情報が含まれます。詳細については、「EventBridge を使用して Athena クエリ イベントをモニタリングする」を参照してください。
2020 年 3 月 6 日
公開日: 2020 年 3 月 6 日
AWS CloudFormation の AWS::Athena::WorkGroup
リソースを使用して、Amazon Athena ワークグループを作成し、更新できるようになりました。詳細については、「AWS CloudFormation ユーザーガイド」の「AWS::Athena::WorkGroup」を参照してください。
Athena リリースノート (2019 年)
2019 年 11 月 26 日
公開日: 2019 年 12 月 17 日
Amazon Athena が、リレーショナル、非リレーショナル、オブジェクト、およびカスタムの各データソース間における SQL クエリの実行、SQL クエリにおける機械学習モデルの呼び出し、ユーザー定義関数 (UDF) (プレビュー)、メタデータカタログとしての Apache Hive メタストアの Amazon Athena での使用 (プレビュー)、および 4 つの追加のクエリ関連メトリクスに対するサポートを追加しました。
フェデレーティッド SQL クエリ
フェデレーティッド SQL クエリを使用して、リレーショナル、非リレーショナル、オブジェクト、カスタムの各データソース間で SQL クエリを実行します。
Athena のフェデレーティッドクエリを使用して、リレーショナル、非リレーショナル、オブジェクト、およびカスタムの各データソースに保存されているデータをスキャンできるようになりました。横串検索を使用すると、ユーザーは単一の SQL クエリを送信することで、オンプレミスで実行されているか、クラウド内でホストされている複数のソースのデータをスキャンできます。
複数のアプリケーションに分散されたデータに対する分析の実行は、以下の理由により、複合型で時間がかかる場合があります。
-
分析に必要なデータは、通常、リレーショナル、キーバリュー、ドキュメント、インメモリ、検索、グラフ、オブジェクト、時系列、および台帳の各データストアに分散されています。
-
これらのソース間のデータを分析するために、分析では複合型のパイプラインを構築してデータを抽出、変換し、データウェアハウスにロードすることで、データにクエリを実行できるようにします。
-
さまざまなソースのデータにアクセスするには、新しいプログラミング言語とデータアクセスコンストラクトを学習する必要があります。
Athena のフェデレーティッド SQL クエリは、データの保管場所にかかわらず、ユーザーがインプレースでデータをクエリできるようにすることで、このような複合型を排除します。アナリストは、使い慣れた SQL コンストラクトを使用して複数のデータソース間でデータを JOIN
してすばやく分析し、後で使用できるようにその結果を Simple Storage Service (Amazon S3) に保存できます。
データソースコネクタ
Athena は、AWS Lambda
カスタムデータソースコネクタ
Athena Query Federation SDK
プレビューの可用性
Athena 横串検索は、米国東部 (バージニア北部) リージョンでプレビューできます。
次のステップ
-
プレビューを開始するには、「Athena プレビュー版の機能に関するよくある質問
」の指示に従ってください。 -
横串検索機能の詳細については、「Amazon Athena 横串検索の使用 (プレビュー)」を参照してください。
-
既存のコネクタの使用を開始するには、「コネクタのデプロイとデータソースへの接続」を参照してください。
-
Athena Query Federation SDK を使用して独自のデータソースコネクタを構築する方法については、GitHub の「Example Athena Connector
」を参照してください。
SQL クエリでの機械学習モデルの呼び出し
推論用の機械学習モデルを Athena クエリから直接呼び出せるようになりました。SQL クエリで機械学習モデルを使用できる場合、異常検知、カスタマーコーホート分析、売上予測などの複合型のタスクが、SQL クエリで機能を呼び出すのと同じくらいシンプルになります。
ML モデル
Amazon SageMaker
プレビューの可用性
本日から米国東部 (バージニア北部) リージョンで Athena の ML 機能をプレビューできます。
次のステップ
-
プレビューを開始するには、「Athena プレビュー版の機能に関するよくある質問
」の指示に従ってください。 -
機械学習機能の詳細については、「Amazon Athena での機械学習 (ML) の使用 (プレビュー)」を参照してください。
ユーザー定義関数 (UDF) (プレビュー)
カスタムスカラー関数を記述して、それらを Athena クエリで呼び出せるようになりました。UDF は、Athena Query Federation SDKSELECT
句と FILTER
句の両方で使用できます。複数の UDF を同じクエリで呼び出せます。
プレビューの可用性
Athena の UDF 機能は、米国東部 (バージニア北部) リージョンでプレビューモードで使用できます。
次のステップ
-
プレビューを開始するには、「Athena プレビュー版の機能に関するよくある質問
」の指示に従ってください。 -
詳細については、「ユーザー定義関数を使用したクエリ (プレビュー)」を参照してください。
-
UDF 実装の例については、GitHub の「Amazon Athena UDF Connector
」を参照してください。 -
Athena Query Federation SDK を使用して独自の関数を記述する方法については、「Lambda を使用した UDF の作成とデプロイ」を参照してください。
Amazon Athena での Apache Hive メタストアのメタカタログとしての使用 (プレビュー)
Athena での AWS Glue Data Catalog に加えて、Athena を 1 つ以上の Apache Hive メタストアに接続できるようになりました。
メタストアコネクタ
自己ホスト型の Hive メタストアに接続するには、Athena Hive メタストアコネクタが必要です。Athena は、これに使用できるリファレンス実装
プレビューの可用性
Hive メタストア機能は、米国東部 (バージニア北部) リージョンでプレビューモードで使用できます。
次のステップ
-
プレビューを開始するには、「Athena プレビュー版の機能に関するよくある質問
」の指示に従ってください。 -
この機能の詳細については、「外部 Hive メタストアの Athena データコネクターの使用 (プレビュー)」を参照してください。
新しいクエリ関連メトリクス
Athena が、Amazon Athena
-
Query Planning Time – クエリを計画するためにかかった時間。これには、データソースからテーブルパーティションを取得するためにかかった時間も含まれます。
-
Query Queuing Time – クエリがキュー内でリソースを待機していた時間。
-
Service Processing Time – クエリエンジンが処理を完了してから結果が書き込まれるまでにかかった時間。
-
Total Execution Time – Athena がクエリを実行するために費やした時間。
これらの新しいクエリメトリクスを使用するには、カスタムダッシュボードを作成する、CloudWatch のメトリクスにアラームとトリガーを設定する、または Athena コンソールから事前入力済みのダッシュボードを直接使用できます。
次のステップ
詳細については、「CloudWatch メトリクスを使用した Athena クエリのモニタリング」を参照してください。
2019 年 11 月 12 日
公開日: 2019 年 12 月 17 日
Amazon Athena が、中東 (バーレーン) リージョンで利用可能になりました。
2019 年 11 月 8 日
公開日: 2019 年 12 月 17 日
Amazon Athena が米国西部 (北カリフォルニア) リージョンと欧州 (パリ) リージョンで利用可能になりました。
2019 年 10 月 8 日
公開日: 2019 年 12 月 17 日
Amazon Athena
Athena に接続するためのインターフェイス VPC エンドポイントを作成するには、AWS Management Console または AWS Command Line Interface (AWS CLI) を使用します。インターフェイスエンドポイントの作成については、「インターフェイスエンドポイントの作成」を参照してください。
インターフェイス VPC エンドポイントを使用すると、VPC と Athena API 間の通信がセキュア化され、AWS ネットワーク内にとどまります。この機能を使用するために、追加の Athena 料金は発生しません。インターフェイス VPC エンドポイントの料金
この機能の詳細については、「インターフェイス VPC エンドポイントを使用して Amazon Athena Connect する」を参照してください。
2019 年 9 月 19 日
公開日: 2019 年 12 月 17 日
Amazon Athena では、INSERT INTO
ステートメントを使用して既存のテーブルに新しいデータを挿入できるようになりました。ソーステーブルで実行される SELECT
クエリステートメント、またはクエリステートメントの一部として提供される値のセットに基づいて、ターゲットテーブルに新しい行を挿入できます。データ形式として Avro、JSON、ORC、Parquet、テキストファイルなどがサポートされています。
INSERT INTO
ステートメントを使用して ETL プロセスを簡素化することもできます。たとえば、単一のクエリで INSERT INTO
を使用することで、JSON 形式のソーステーブルからデータを選択して Parquet 形式のターゲットテーブルに書き込めます。
INSERT INTO
ステートメントは、Athena での SELECT
クエリの場合と同様に、SELECT
フェーズでスキャンしたバイト数に基づいて課金されます。詳細については、「Amazon Athena の料金
サポートされている形式、SerDes、および例などの INSERT INTO
の使用に関する詳細については、Athena ユーザーガイドの「INSERT INTO」を参照してください。
2019 年 9 月 12 日
公開日: 2019 年 12 月 17 日
Amazon Athena が、アジアパシフィック (香港) リージョンで利用可能になりました。
2019 年 8 月 16 日
公開日: 2019 年 12 月 17 日
Amazon Athena
Amazon S3 バケットがリクエスタ支払いとして設定されている場合、Amazon S3 リクエストとデータ転送のコストは、バケット所有者ではなくリクエスタが支払います。Athena では、ワークグループ管理者が、ワークグループメンバーによる S3 リクエスタ支払いバケットへのクエリを許可するようにワークグループを設定できるようになりました。
ワークグループのリクエスタ支払い設定を行う方法については、Amazon Athena ユーザーガイドの「ワークグループの作成」を参照してください。リクエスタ支払いバケットの詳細については、「Amazon Simple Storage Service デベロッパーガイド」の「リクエスタ支払いバケット」を参照してください。
2019 年 8 月 9 日
公開日: 2019 年 12 月 17 日
Amazon Athena が、Simple Storage Service (Amazon S3) に保存されたデータ用の AWS Lake Formation
この機能は、米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (オレゴン)、アジアパシフィック (東京)、および欧州 (アイルランド) の各 AWS リージョン で利用できます。この機能の使用に追加料金は発生しません。
この機能の使用方法については、「Athena を使用して AWS Lake Formation に登録されたデータをクエリする」を参照してください。の詳細については、「AWS Lake Formation」を参照してください。AWS Lake Formation
2019 年 6 月 26 日
Amazon Athena が欧州 (ストックホルム) リージョンで利用可能になりました。サポートされているリージョンのリストについては、「AWS リージョン およびエンドポイント」を参照してください。
2019 年 5 月 24 日
公開日: 2019 年 05 月 24 日
Amazon Athena が AWS GovCloud (米国東部) および AWS GovCloud (米国西部) の各リージョンで利用可能になりました。サポートされているリージョンのリストについては、AWS リージョン およびエンドポイントを参照してください。
2019 年 3 月 5 日
公開日: 2019 年 03 月 05 日
Amazon Athena がカナダ (中部) リージョンで利用可能になりました。サポートされているリージョンのリストについては、AWS リージョン およびエンドポイントを参照してください。Athena ワークグループをサポートする新しいバージョンの ODBC ドライバーがリリースされました。詳細については、「ODBC ドライバーリリースノート
ODBC ドライバーのバージョン 1.0.5 とそのドキュメントをダウンロードするには、「ODBC で Amazon Athena に接続する」を参照してください。このバージョンの詳細については、「ODBC ドライバーリリースノート
ODBC ドライバーでワークグループを使用するには、次の例に示すように、接続文字列に新しい接続プロパティ Workgroup
を設定します。
Driver=Simba Athena ODBC Driver;AwsRegion=[Region];S3OutputLocation=[S3Path];AuthenticationType=IAM Credentials;UID=[YourAccessKey];PWD=[YourSecretKey];Workgroup=[WorkgroupName]
詳細については、「ODBC ドライバーのインストールおよび設定ガイドバージョン 1.0.5
このドライバーバージョンでは、Athena API ワークグループアクションを使用してワークグループを作成および管理し、Athena API タグアクションを使用してワークグループのタグを追加、リスト化、または削除できます。使用を開始する前に、ワークグループとタグに対するアクションに関するリソースレベルの IAM 許可があることを確認してください。
詳細については、以下を参照してください。
JDBC ドライバー、または AWS SDK を使用している場合は、最新バージョンのドライバーと SDK にアップグレードしてください。どちらにも、Athena のワークグループとタグのサポートが既に含まれています。詳細については、「JDBC で Amazon Athena に接続する」を参照してください。
2019 年 2 月 22 日
公開日: 2019 年 02 月 22 日
Amazon Athena のワークグループにタグのサポートを追加しました。タグは、1 つのキーと 1 つの値で構成されており、どちらもお客様側が定義します。ワークグループにタグを付けるときは、カスタムメタデータを割り当てます。AWS タグ付けのベストプラクティスを使用して、ワークグループにタグを追加してそれらを分類できます。タグを使用してワークグループへのアクセスを制限し、コストを追跡できます。たとえば、コストセンターごとにワークグループを作成します。その後、これらのワークグループにタグを追加することで、各コストセンターの Athena 支出を追跡できます。詳細については、「AWS Billing and Cost Management ユーザーガイド」の「請求へのタグの使用」を参照してください。
タグは、Athena コンソール、または API オペレーションを使用することで操作できます。詳細については、「Athena リソースにタグ付けする」を参照してください。
Athena コンソールでは、各ワークグループに 1 つ、または複数のタグを追加して、それらをタグで検索できます。ワークグループは、Athena にある IAM で管理されるリソースです。IAM では、作成したワークグループのタグを追加、削除、またはリスト化できるユーザーを制限できます。ワークグループに 1 つ以上のタグを追加するためのオプションのタグパラメータを持つ CreateWorkGroup
API オペレーションを使用することもできます。タグを追加、削除、または一覧表示するには、TagResource
、UntagResource
、および ListTagsForResource
を使用します。詳細については、「API および AWS CLI タグオペレーションを使用する」を参照してください。
ワークグループの作成時にユーザーがタグを追加できるようにするには、各ユーザーに TagResource
と CreateWorkGroup
の API アクションの両方に対する IAM 許可を付与するようにしてください。詳細な説明と例については、「タグベースの IAM アクセスコントロールポリシーを使用する」を参照してください。
ワークグループでタグを使用しても、JDBC ドライバーは変更されません。新しいワークグループを作成して JDBC ドライバーまたは AWS SDK を使用する場合は、最新バージョンのドライバーと SDK に更新してください。詳細については、JDBC で Amazon Athena に接続する を参照してください。
2019 年 2 月 18 日
公開日: 2019 年 02 月 18 日
ワークグループでクエリを実行することによってクエリコストを制御する機能が追加されました。詳細については、ワークグループを使用してクエリのアクセスとコストを制御する を参照してください。Athena で使用される JSON OpenX SerDe を改善し、Athena が GLACIER
ストレージクラスに移行されたオブジェクトを無視しないという問題を修正しました。また、Network Load Balancer ログをクエリする例を追加しました。
以下の変更を加えました。
-
ワークグループ用のサポートを追加しました。ワークグループを使用して、ユーザー、チーム、アプリケーション、またはワークロードを分離し、各クエリまたはワークグループ全体で処理できるデータ量に制限を設定します。ワークグループは IAM リソースとして機能するため、リソースレベルのアクセス許可を使用して特定のワークグループへのアクセスを制御できます。Amazon CloudWatch でクエリ関連のメトリクスを表示する、スキャンされるデータの量に制限を設定することによってクエリコストを管理する、しきい値を作成する、およびこれらのしきい値を超えたときに Amazon SNS アラームなどのアクションをトリガーすることもできます。詳細については、ワークグループを使用してクエリのアクセスとコストを制御するおよびCloudWatch と EventBridge を使用してクエリをモニタリングし、コストを管理するを参照してください。
ワークグループは、IAM リソースです。IAM のワークグループ関連のアクション、リソース、および条件の完全なリストについては、「Service Authorization Reference」の「Actions, Resources, and Condition Keys for Amazon Athena」を参照してください。新しいワークグループを作成する前に、ワークグループの IAM ポリシーと AWS 管理ポリシー: AmazonAthenaFullAccess を使用するようにしてください。
ワークグループ API オペレーション、または JDBC ドライバーを使用して、コンソールでワークグループを使用できます。ワークグループ作成の詳細については、「ワークグループの作成」を参照してください。ワークグループサポート付きの JDBC ドライバーをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。
JDBC ドライバーでワークグループを使用する場合は、次の例のように
Workgroup
設定パラメータを使用して接続文字列にワークグループ名を設定する必要があります。jdbc:awsathena://AwsRegion=
<AWSREGION>
;UID=<ACCESSKEY>
; PWD=<SECRETKEY>
;S3OutputLocation=s3://amzn-s3-demo-bucket/<athena-output>
-<AWSREGION>
/; Workgroup=<WORKGROUPNAME>
;SQL ステートメントの実行方法やドライバーへの JDBC API 呼び出しの方法に変更はありません。ドライバーがワークグループ名を Athena に渡します。
ワークグループに導入された変更点については、「Athena ワークグループ API を使用する」および「ワークグループエラーのトラブルシューティング」を参照してください。
-
Athena で使用される JSON OpenX SerDe を改善しました。改善点は次のとおりです。
-
ConvertDotsInJsonKeysToUnderscores
プロパティをサポートします。TRUE
に設定すると、SerDe はキー名のドットをアンダースコアに置き換えることができます。たとえば、JSON データセットに"a.b"
という名前のキーが含まれている場合は、このプロパティを使用して、Athena で列名が"a_b"
になるように定義できます。デフォルト:FALSE
。デフォルトで、Athena は列名にドットを許可しません。 -
case.insensitive
プロパティをサポートします。デフォルトで、Athena では JSON データセットのすべてのキーに小文字が使用される必要があります。WITH SERDE PROPERTIES ("case.insensitive"= FALSE;)
を使用すると、データ内で大文字と小文字を区別してキー名を使用できます。デフォルト:TRUE
。TRUE
に設定すると、SerDe はすべての大文字の列を小文字に変換します。
詳細については、「OpenX JSON SerDe」を参照してください。
-
-
Simple Storage Service (Amazon S3) ライフサイクルポリシーによって Glacier にアーカイブされた Amazon S3 オブジェクトを処理したときに、Athena が
"access denied"
エラーメッセージを返す問題を修正しました。この問題を解決した結果、Athena がGLACIER
ストレージクラスに移行したオブジェクトを無視するようになりました。Athena では、GLACIER
ストレージクラスからのデータのクエリがサポートされていません。詳細については、「Amazon S3 に関する考慮事項」および「Amazon Simple Storage Service ユーザーガイド」の「Transitioning to the GLACIER Storage Class (Object Archival)」(GLACIER ストレージクラスへの移行 (オブジェクトのアーカイブ)) を参照してください。
-
Transport Layer Security (TLS) リクエストに関する情報を受け取る Network Load Balancer アクセスログのクエリ例を追加しました。詳細については、「Network Load Balancer のログをクエリする」を参照してください。
Athena リリースノート (2018 年)
2018 年 11 月 20 日
公開日: 2018 年 11 月 20 日
AD FS および SAML 2.0 (Security Assertion Markup Language 2.0) を使用した Athena API へのフェデレーションアクセスをサポートする新しいバージョンの JDBC および ODBC ドライバーをリリースしました。詳細については、「JDBC ドライバーリリースノート
このリリースによって、Athena へのフェデレーションアクセスが Active Directory Federation Service (AD FS 3.0) 対応になります。アクセスは、SAML 2.0 をサポートするバージョンの JDBC や ODBC ドライバーを通じて確立されます。Athena API へのフェデレーションアクセスの設定に関する詳細については、「Athena API へのフェデレーションアクセスを有効にする」を参照してください。
JDBC ドライバーのバージョン 2.0.6 とそのドキュメントをダウンロードするには、「JDBC で Amazon Athena に接続する」を参照してください。このバージョンの詳細については、「JDBC ドライバーリリースノート
ODBC ドライバーのバージョン 1.0.4 とそのドキュメントをダウンロードするには、「ODBC で Amazon Athena に接続する」を参照してください。このバージョンの詳細については、「ODBC ドライバーリリースノート
AWS での SAML 2.0 のサポートに関する詳細については、「IAM ユーザーガイド」の「SAML 2.0 ベースのフェデレーションについて」を参照してください。
2018 年 10 月 15 日
公開日: 2018 年 10 月 15 日
AWS Glue Data Catalog にアップグレードしている場合は、以下のサポートを提供する 2 つの新機能があります。
-
データカタログメタデータの暗号化。データカタログでメタデータを暗号化することを選択する場合は、Athena に特定のポリシーを追加する必要があります。詳細については、「AWS Glue Data Catalog の暗号化されたメタデータへのアクセス」を参照してください。
-
AWS Glue Data Catalog のリソースへのアクセスに対するきめ細かなアクセス許可。Athena で使用されるデータカタログからの特定のデータベースとテーブルへのアクセスを制限または許可する、アイデンティティベースの (IAM) ポリシーを定義できるようになりました。詳細については、「AWS Glue Data Catalog のデータベースとテーブルへのアクセスを構成する」を参照してください。
注記
データは Amazon S3 バケットに格納されており、それらに対するアクセスは Athena から Amazon S3 へのアクセスを制御する によって制御されます。データベースとテーブル内のデータにアクセスするには、データを保存する Amazon S3 バケットへのアクセスコントロールポリシーを引き続き使用します。
2018 年 10 月 10 日
公開日: 2018 年 10 月 10 日
Athena では、SELECT
クエリステートメントの結果からテーブルを作成する CREATE TABLE AS SELECT
がサポートされています。詳細については、「クエリ結果からのテーブルの作成 (CTAS)」を参照してください。
CTAS クエリを作成する前に、Athena ドキュメントでそれらの動作について学習しておくことが重要です。ドキュメントには、クエリ結果を保存するための Amazon S3 の場所、CTAS クエリ結果を保存するためにサポートされている形式のリスト、作成できるパーティションの数、およびサポートされている圧縮形式に関する情報が記載されています。詳細については、「CTAS クエリに関する考慮事項と制約事項」を参照してください。
以下の目的で CTAS クエリを使用します。
-
1 つのステップでクエリ結果からテーブルを作成します。
-
例を使用して、Athena コンソールで CTAS クエリを作成します。構文については「CREATE TABLE AS」を参照してください。
-
クエリ結果を他のストレージ形式 (例: PARQUET、ORC、AVRO、JSON、TEXTFILE) に変換します。詳細については、CTAS クエリに関する考慮事項と制約事項および列指向ストレージ形式を使用するを参照してください。
2018 年 9 月 6 日
公開日: 2018 年 09 月 06 日
ODBC ドライバーの新しいバージョン (バージョン 1.0.3) がリリースされました。新しいバージョンの ODBC ドライバーは、ページングではなく、デフォルトで結果をストリーミングします。これによりビジネスインテリジェンスツールで大規模なデータセットを迅速に取得できます。このバージョンには改善点、バグ修正、および更新された「プロキシサーバーで SSL を使用する」ドキュメントが含まれています。詳細については、ドライバーの「リリースノート
ODBC ドライバーのバージョン 1.0.3 とそのドキュメントのダウンロードについては、「ODBC で Amazon Athena に接続する」を参照してください。
結果のストリーミング機能は、新しいバージョンの ODBC ドライバーでのみ使用できます。JDBC ドライバーでも使用できます。結果のストリーミングの詳細については、「ODBC ドライバーのインストールおよび設定ガイド
ODBC ドライバーのバージョン 1.0.3 は、以前のバージョンのドライバーのドロップインリプレースです。最新のドライバーに移行することをお勧めします。
重要
ODBC ドライバーバージョン 1.0.3 を使用するには、次の要件に従ってください。
-
アウトバウンドトラフィックに対してポート 444 を開いたままにする。
-
Athena のポリシーのリストに
athena:GetQueryResultsStream
ポリシーアクションを追加する。このポリシーアクションは、API で直接公開されていません。結果のストリーミングサポートの一部として ODBC ドライバーおよび JDBC ドライバーとともに使用するだけです。ポリシーの例については、「AWS 管理ポリシー: AWSQuicksightAthenaAccess」を参照してください。
2018 年 8 月 23 日
公開日: 2018 年 08 月 23 日
次に示すとおり DDL に関連する機能のサポートが追加され、バグがいくつか修正されました。
-
Parquet のデータの
BINARY
とDATE
データ型、Avro のデータのDATE
とTIMESTAMP
データ型のサポートが追加されました。 -
DDL クエリの
INT
とDOUBLE
のサポートが追加されました。INTEGER
はINT
のエイリアス、DOUBLE PRECISION
はDOUBLE
のエイリアスです。 -
DROP TABLE
とDROP DATABASE
のクエリのパフォーマンスが改善されました。 -
データバケットが空になっているときに Simple Storage Service (Amazon S3) で
_$folder$
オブジェクトが作成されなくなりました。 -
パーティション値が指定されなかった場合、
ALTER TABLE ADD PARTITION
がエラーをスローする問題を修正しました。 -
ステートメントに修飾名が指定された後に、パーティションをチェックするときに、
DROP TABLE
がデータベース名を無視する問題を修正しました。
Athena でサポートされているデータ型の詳細については、「Amazon Athena のデータ型」を参照してください。
Athena、JDBC ドライバー、および Java のデータ型間でサポートされているデータ型マッピングについては、「ODBC Driver Installation and Configuration Guide」の「Data Types
2018 年 8 月 16 日
公開日: 2018 年 08 月 16 日
JDBC ドライバーのバージョン 2.0.5 がリリースされました。新しいバージョンの JDBC ドライバーは、ページングではなく、デフォルトで結果をストリーミングします。これによりビジネスインテリジェンスツールで大規模なデータセットを迅速に取得できます。JDBC ドライバーの以前のバージョンと比較して、次のパフォーマンスが向上しています。
-
10,000 行未満を取得するときに、パフォーマンスが約 2 倍向上します。
-
10,000 行以上を取得するときに、パフォーマンスが 5 ~ 6 倍向上します。
結果のストリーミング機能は、JDBC ドライバーでのみ使用できます。ODBC ドライバーでは使用できません。これを Athena API で使用することはできません。結果のストリーミングの詳細については、「JDBC ドライバーのインストールおよび設定ガイド
JDBC ドライバーのバージョン 2.0.5 とそのドキュメントのダウンロードについては、「JDBC で Amazon Athena に接続する」を参照してください。
JDBC ドライバーのバージョン 2.0.5 は、以前のバージョンのドライバー (2.0.2) のドロップインリプレースです。JDBC ドライバーバージョン 2.0.5 が必ず使用されるようにするには、Athena のポリシーのリストに athena:GetQueryResultsStream
ポリシーアクションを追加します。このポリシーアクションは、API で直接公開されていません。結果のストリーミングサポートの一部として JDBC ドライバーとともに使用するだけです。ポリシーの例については、「AWS 管理ポリシー: AWSQuicksightAthenaAccess」を参照してください。ドライバーのバージョン 2.0.2 からバージョン 2.0.5 への移行の詳細については、「JDBC ドライバー移行ガイド
ドライバーをバージョン 1.x から 2.x に移行する場合は、既存の設定を新しい設定に移行する必要があります。最新バージョンのドライバーに移行することを強くお勧めします。詳細については、「JDBC Driver Migration Guide
2018 年 8 月 7 日
公開日: 2018 年 08 月 07 日
Amazon Virtual Private Cloud フローログを Amazon S3 に GZIP 形式で直接保存できるようになりました。これらは、Athena でクエリすることができます。詳細については、「Amazon VPC フローログのクエリ」および「Amazon VPC フローログが S3 で使用可能に
2018 年 5 月 6 日
公開日: 2018 年 06 月 05 日
ビューのサポート
ビューのサポートが追加されました。Athena で CREATE VIEW および CREATE DIALECT VIEW、DESCRIBE VIEW、DROP VIEW、SHOW CREATE VIEW、および SHOW VIEWS が使用できるようになりました。ビューを定義するクエリは、クエリでビューを参照するたびに実行されます。詳細については、「ビューを使用する」を参照してください。
エラーメッセージの改善と更新
-
GSON 2.8.0 ライブラリを CloudTrail SerDe に含めることで、CloudTrail SerDe の問題を解決し、JSON 文字列の改正を有効にしました。
-
列の順序変更を可能にすることによって、Parquet (場合によっては ORC) に対する Athena でのパーティションスキーマ検証が強化されました。これにより、Athena では徐々に進化するスキーマの変化と AWS Glue クローラから追加されるテーブルに適切に対応できるようになりました。詳細については、「スキーマの更新を処理する」を参照してください。
-
SHOW VIEWS
に解析サポートが追加されました。 -
最も一般的なエラーメッセージに次の改善が加えられました。
-
Athena クエリで SerDe が列の解析に失敗するときの「
Internal Error
」メッセージを、説明的なエラーメッセージに置き換えました。これまで、Athena は解析エラーの場合に内部エラーを発行していました。新しいエラーメッセージは次のようになります。「HIVE_BAD_DATA: フィールド 0: java.lang のフィールド値の解析エラー。文字列は org.openx.data.jsonserde.json.JSONObject にキャストできません」
。 -
アクセス許可不足のエラーメッセージが改善されて、詳細が追加されました。
-
バグ修正
以下のバグを修正しました。
-
REAL
からFLOAT
データ型への内部変換を有効にする問題が修正されました。これにより、FLOAT
データ型を返す AWS Glue クローラの統合が改善されました。 -
Athena が AVRO
DECIMAL
(論理的な型) をDECIMAL
型に変換しない問題が修正されました。 -
WHERE
句がTIMESTAMP
データ型の値を参照している場合に、Parquet データをクエリすると、Athena で 結果が返されないという問題を修正しました。
2018 年 5 月 17 日
公開日: 2018 年 05 月 17 日
Athena でのクエリ同時実行のクォータが 5 件から 20 件に増加されました。これによって、20 件までの DDL
クエリおよび 20 件までの SELECT
クエリを同時に送信して実行できます。同時実行数のクォータは、DDL
および SELECT
クエリで別であることに注意してください。
Athena での同時実行クォータは、サービスに対して同時に送信できるクエリの数として定義されます。同じタイプ (DDL
あるいは SELECT
) のクエリを同時に 20 件まで送信できます。同時実行クエリのクォータを超えるクエリを送信すると、Athena API がエラーメッセージを表示します。
Athena にクエリを送信すると、Athena は、全体的なサービス負荷と着信リクエストの量に基づいてリソースを割り当てることによってクエリを処理します。当社では継続的にサービスをモニタリングして調整を行うため、お客様のクエリはできるだけ短期間で処理されます。
詳細については、Service Quotas を参照してください。これは調整可能なクォータです。Service Quotas コンソール
2018 年 4 月 19 日
公開日: 2018 年 04 月 19 日
配列データ型として ResultSet
を返すサポート、改良点、およびバグ修正を反映した、新しいバージョンの JDBC ドライバー (バージョン 2.0.2) をリリースしました。詳細については、ドライバーの「リリースノート
JDBC ドライバーの新しいバージョン 2.0.2 とそのドキュメントのダウンロードについては、「JDBC で Amazon Athena に接続する」を参照してください。
JDBC ドライバーの最新バージョンは 2.0.2 です。ドライバーをバージョン 1.x から 2.x に移行する場合は、既存の設定を新しい設定に移行する必要があります。最新のドライバーに移行することを強くお勧めします。
新しいバージョンのドライバーの変更点、バージョンの相違点、例については、「JDBC ドライバー移行ガイド
2018 年 4 月 6 日
公開日: 2018 年 04 月 06 日
Athena コンソールでのクエリの入力に自動入力を使用します。
2018 年 3 月 15 日
公開日: 2018 年 03 月 15 日
CloudTrail コンソールから直接 CloudTrail ログファイル用の Athena テーブルを自動作成する機能を追加しました。詳細については、CloudTrail ログ用の Athena テーブルを作成するために CloudTrail コンソールを使用する を参照してください。
2018 年 2 月 2 日
公開日: 2018 年 02 月 12 日
GROUP BY
句を使用するメモリに大きな負担をかけるクエリのディスクに中間データを安全にオフロードする機能が追加されました。これでこのようなクエリの信頼性が向上し、「Query resource exhausted
」(クエリリソースの枯渇) エラーを回避します。
2018 年 1 月 19 日
公開日: 2018 年 01 月 19 日
Athena は、オープンソースの分散型クエリエンジンである Presto を使用してクエリを実行します。
Athena には管理するバージョンがありません。Athena の基盤となるエンジンを Presto 0.172 に基づくバージョンに透過的にアップグレードしました。ユーザー操作は必要はありません。
このアップグレードにより、Athena で Presto 0.172 Lambda Expressions を含めた Presto 0.172 Functions and Operators を使用できるようになります。
このリリースの主な更新 (コミュニティ提供の修正を含む) は以下のとおりです。
-
ヘッダーを無視するサポート。Athena がヘッダーを無視できるように、テーブルの定義時に
skip.header.line.count
プロパティを使用できます。これは、Grok または Regex SerDes ではなく、LazySimpleSerDe と OpenCSV SerDe を使用するクエリをサポートします。 -
STRING
関数でのCHAR(n)
データ型のサポート。CHAR(n)
の範囲は[1.255]
です。VARCHAR(n)
の範囲は[1,65535]
です。 -
相関サブクエリのサポート。
-
Presto Lambda 式および関数のサポート。
-
DECIMAL
型と演算子のパフォーマンスが向上しました。 -
フィルタ処理された集計のサポート (
SELECT sum(col_name) FILTER
であるid > 0
など)。 -
DECIMAL
、TINYINT
、SMALLINT
、およびREAL
の各データ型のプッシュダウン述語。 -
限定比較述語のサポート (
ALL
、ANY
、およびSOME
)。 -
追加された関数:
arrays_overlap()
、 array_except()
、 levenshtein_distance()
、 codepoint()
、 skewness()
、 kurtosis()
、および typeof()
。 -
タイムゾーン引数を使用する
from_unixtime()
関数のバリアントを追加しました。 -
bitwise_and_agg()
集計関数と bitwise_or_agg()
集計関数を追加しました。 -
xxhash64()
関数と to_big_endian_64()
関数を追加しました。 -
JSON パスの添字でバックスラッシュを使用して二重引用符やバックスラッシュをエスケープするためのサポートを
json_extract()
関数と json_extract_scalar()
関数に追加しました。これまでバックスラッシュは標準の文字として扱われていたために、これによってバックスラッシュを使用した呼び出しのセマンティクスが変わります。
関数と演算子については、本ガイドの「DML クエリ、関数、および演算子」、および Presto ドキュメントの「関数と演算子
Athena はすべての Presto 機能をサポートしません。詳細については、「制限」を参照してください。
Athena リリースノート (2017 年)
2017 年 11 月 13 日
公開日: 2017 年 11 月 13 日
Athena を ODBC ドライバーに接続するためのサポートを追加しました。詳細については、ODBC で Amazon Athena に接続する を参照してください。
2017 年 11 月 1 日
公開日: 2017 年 11 月 01 日
地理空間データのクエリのサポートをアジアパシフィック (ソウル)、アジアパシフィック (ムンバイ)、および欧州 (ロンドン) の各リージョンに追加しました。詳細については、「地理空間データをクエリする」と「AWS リージョン とエンドポイント」を参照してください。
2017 年 10 月 19 日
公開日: 2017 年 10 月 19 日
欧州 (フランクフルト) のサポートを追加しました。サポートされているリージョンの一覧は、「AWS リージョン とエンドポイント」を参照してください。
2017 年 10 月 3 日
公開日: 2017 年 10 月 03 日
AWS CloudFormation で名前付き Athena クエリを作成します。詳細については、「ユーザーガイド」の「AWS::Athena::NamedQuery」を参照してください。
2017 年 9 月 25 日
公開日: 2017 年 09 月 25 日
アジアパシフィック (シドニー) リージョンのサポートを追加しました。サポートされているリージョンの一覧は、「AWS リージョン とエンドポイント」を参照してください。
2017 年 8 月 14 日
公開日: 2017 年 08 月 14 日
AWS Glue Data Catalog との統合を追加したほか、Athena で管理されるデータカタログから AWS Glue Data Catalog に更新するための移行ウィザードを追加しました。詳細については、「AWS Glue を使用して Athena を Amazon S3 のデータに接続する」を参照してください。
2017 年 8 月 4 日
公開日: 2017 年 08 月 04 日
Grok SerDe のサポートを追加しました。これにより、ログなどの構造化されていないテキストファイルのレコードのパターンマッチングが容易になります。詳細については、「Grok SerDe」を参照してください。コンソールを使用してクエリ履歴をスクロールするためのキーボードショートカットを追加しました (Windows での CTRL +⇧/⇩、Mac での CMD + ⇧/⇩)。
2017 年 6 月 22 日
公開日: 2017 年 06 月 22 日
アジアパシフィック (東京) およびアジアパシフィック (シンガポール) の各リージョンのサポートを追加しました。サポートされているリージョンの一覧は、「AWS リージョン とエンドポイント」を参照してください。
2017 年 6 月 8 日
公開日: 2017 年 06 月 08 日
欧州 (アイルランド) のサポートを追加しました。詳細については、AWS リージョン およびエンドポイントを参照してください。
2017 年 5 月 19 日
公開日: 2017 年 05 月 19 日
Amazon Athena API および Athena 用の AWS CLI サポートを追加し、JDBC ドライバーをバージョン 1.1.0 に更新しました。また、さまざまな問題を修正しました。
-
Amazon Athena により、Athena のアプリケーションプログラミングが可能になります。詳細については、「Amazon Athena API リファレンス」を参照してください。最新の AWS SDK には、Athena API のサポートが含まれています。ドキュメントとダウンロードのリンクについては、「Amazon Web Services のツール」の「SDK
」セクションを参照してください。 -
AWS CLI には、Athena 用の新しいコマンドが含まれています。詳細については、「Amazon Athena API リファレンス」を参照してください。
-
新しい JDBC ドライバー 1.1.0 が利用可能になりました。最新バージョンでは、新しい Athena API のサポート、最新の特徴、バグ修正が追加されています。ドライバーを https://downloads.athena.us-east-1.amazonaws.com/drivers/AthenaJDBC41-1.1.0.jar
からダウンロードしてください。最新の Athena JDBC ドライバーにアップグレードすることをお勧めします。ただし、以前のドライバーバージョンもまだ使用できます。以前のドライバーバージョンでは Athena API をサポートしていません。詳細については、「JDBC で Amazon Athena に接続する」を参照してください。 -
以前のバージョンの Athena でポリシーステートメント固有であったアクションは廃止されました。JDBC ドライバーバージョン 1.1.0 にアップグレードして、カスタマー管理の IAM ポリシーやインライン IAM ポリシーを JDBC ユーザーにアタッチする場合は、IAM ポリシーを更新する必要があります。一方、以前のバージョンの JDBC ドライバーは Athena API をサポートしていないため、廃止されたアクションは以前のバージョンの JDBC ユーザーにアタッチされているポリシーでのみ指定できます。このため、カスタマー管理の IAM ポリシーやインライン IAM ポリシーを更新する必要はありません。
-
これらのポリシー固有のアクションは、Athena API のリリース前に Athena で使用されていたものです。これらの廃止されたアクションは、バージョン 1.1.0 より前の JDBC ドライバーのポリシーでのみ使用します。JDBC ドライバーをアップグレードする場合は、廃止されたアクションを許可または拒否するポリシーステートメントを、以下に示す適切な API アクションに置き換えてください。置き換えないと、エラーが発生します。
廃止されたポリシー固有のアクション | 対応する Athena API アクション |
---|---|
|
|
|
|
|
|
改良点
-
クエリ文字列の長さの上限を 256 KB に増やしました。
バグ修正
-
コンソールでクエリ結果をスクロールしたときに正常に表示されない問題を修正しました。
-
Amazon S3 データファイルの
\u0000
文字列のせいでエラーが発生するという問題を修正しました。 -
JDBC ドライバーを通じて行ったクエリキャンセルのリクエストが失敗するという問題を修正しました。
-
米国東部 (オハイオ) の Simple Storage Service (Amazon S3) データで AWS CloudTrail SerDe が失敗するという問題を修正しました。
-
パーティションされたテーブルで
DROP TABLE
が失敗するという問題を修正しました。
2017 年 4 月 4 日
公開日: 2017 年 04 月 04 日
Amazon S3 のデータ暗号化のサポートを追加しました。また、暗号化のサポート、改良点、およびバグ修正を反映した JDBC ドライバーのアップデート (バージョン 1.0.1) をリリースしました。
機能
-
以下の暗号化機能を追加しました。
-
Amazon S3 の暗号化されたデータのクエリのサポート。
-
Athena クエリ結果の暗号化のサポート。
-
-
新しいバージョンのドライバーは新しい暗号化機能をサポートし、改良点とバグ修正を追加しました。
-
ALTER TABLE
を使用して列を追加、置換、変更する機能を追加しました。詳細については、Hive ドキュメントの「Alter 列」を参照してください。 -
LZO 圧縮データのクエリのサポートを追加しました。
詳細については、「保管中の暗号化」を参照してください。
改良点
-
JDBC のクエリパフォーマンスが向上しました。ページサイズの改善により、100 行ではなく 1,000 行が返されます。
-
JDBC ドライバーインターフェイスを使用してクエリをキャンセルする機能を追加しました。
-
JDBC 接続 URL で JDBC オプションを指定する機能を追加しました。最新の JDBC ドライバーについては、「JDBC で Amazon Athena に接続する」を参照してください。
-
ドライバーでの PROXY 設定を追加しました。この設定は、AWS SDK for Java の ClientConfiguration を使用して行えます。
バグ修正
以下のバグを修正しました。
-
JDBC ドライバーを使用して複数のクエリを実行すると、スロットリングエラーが発生する場合がある。
-
decimal データ型の射影時に JDBC ドライバーが停止する。
-
テーブルでのデータ型の定義に関係なく、JDBC ドライバーはすべてのデータ型を文字列として返す。たとえば、
INT
データ型として定義されている列をresultSet.GetObject()
を使用して選択すると、INT
データ型が返されずにSTRING
データ型が返される。 -
JDBC ドライバーでの認証情報の検証が、クエリの実行時に行われずに接続時に行われる。
-
スキーマを URL と共に指定すると、JDBC ドライバーを介したクエリが失敗する。
2017 年 3 月 24 日
公開日: 2017 年 03 月 24 日
AWS CloudTrail SerDe の追加、パフォーマンスの向上、およびパーティション問題の修正を行いました。
機能
-
CloudTrail ログを読み込むため、Hive JSON SerDe によって置き換えられた AWS CloudTrail SerDe が追加されました。CloudTrail ログのクエリについては、「AWS CloudTrail ログをクエリする」を参照してください。
改良点
-
多数のパーティションをスキャンするときのパフォーマンスを改善しました。
-
MSCK Repair Table
オペレーションのパフォーマンスを改善しました。 -
プライマリリージョン以外のリージョンに保存されている Amazon S3 データをクエリする機能を追加しました。標準の Athena 料金に加えて、Amazon S3 の標準のリージョン間データ転送料金が適用されます。
バグ修正
-
パーティションがロードされないときに「テーブルが見つかりません」エラーが発生するバグを修正しました。
-
ALTER TABLE ADD PARTITION IF NOT EXISTS
クエリで例外がスローされないようにバグを修正しました。 -
DROP PARTITIONS
のバグを修正しました。
2017 年 2 月 20 日
公開日: 2017 年 02 月 20 日
AvroSerDe と OpenCSVSerDe、米国東部 (オハイオ) リージョン、およびコンソールウィザードでの列の一括編集のサポートを追加しました。大規模な Parquet テーブルのパフォーマンスを改善しました。
機能
-
以下の新しい SerDe のサポートを導入しました。
-
米国東部 (オハイオ) リージョン (us-east-2) での起動。このリージョンでクエリを実行できるようになりました。
-
これで [Create Table From S3 bucket data] (S3 バケットデータからテーブルを作成) フォームを使用して、テーブルスキーマを一括で定義できるようになりました。クエリエディタで [Create] (作成)、[S3 bucket data] (S3 バケットデータ) と選択し、さらに [Column details] (列の詳細) セクションの [Bulk add columns] (列の一括追加) を選択します。
テキストボックスに名前と値のペアを入力し、[Add] を選択します。
改良点
-
大規模な Parquet テーブルのパフォーマンスを改善しました。