リリースノート - Amazon Athena

リリースノート

Amazon Athena の特徴、改良点、およびバグ修正についてリリース日順に説明します。

Athena リリースノート (2022 年)

2022 年 9 月 13 日

公開日: 2022 年 9 月 13 日

Athena は、次の修正と改善を発表しました。

  • CloudTrail — CloudTrail ログをクエリするための CREATE TABLE DDL が更新され、不足しているフィールドが追加されました。また、特定のデータ型が修正され、CloudTrail SerDe の代わりに JSON SerDe が使用されるようになりました。詳細については、「AWS CloudTrail ログのクエリ」を参照してください。

  • 外部 Hive メタストア外部 Hive メタストア (EHMS) に存在しないパーティションが WHERE 句に含まれている場合、Athena で例外をスローする代わりに NULL を返すようになりました。  新しい動作は AWS Glue Data Catalog の動作と一致します。

  • パラメータ化されたクエリパラメータ化されたクエリの値を DOUBLE データ型にキャストできるようになりました。

  • Apache Iceberg — Amazon S3 バケットでオブジェクトロックが有効である場合に、Iceberg テーブルに書き込みオペレーションができるようになりました。

2022 年 8 月 31 日

公開日: 2022 年 8 月 31 日

Amazon Athena では、アジアパシフィック (ジャカルタ) リージョンで Athena とその機能が利用可能になりました。

このリリースで、アジアパシフィックでの Athena の提供が拡張され、アジアパシフィック (香港)、アジアパシフィック (ジャカルタ)、アジアパシフィック (ムンバイ)、アジアパシフィック (大阪)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、およびアジアパシフィック (東京) が含まれるようになりました。これらのリージョンや他のリージョンで利用可能な AWS のサービス の詳細な一覧については、「AWS リージョン 別のサービス表」を参照してください。

2022 年 8 月 23 日

公開日: 2022 年 8 月 23 日

Athena Query Federation SDK のリリース v2022.32.1 には、次の変更が含まれています。

  • Amazon RDS インスタンスへの SSL ベースの接続用に、Amazon Athena Oracle データソースコネクタのサポートが追加されました。このサポートは、Transport Layer Security (TLS) プロトコルと、クライアントによるサーバーの認証に限定されています。相互認証は Amazon RDS でサポートされていないため、相互認証のサポートは更新に含まれていません。

    詳細については、「Amazon Athena Oracle コネクタ」を参照してください。

2022 年 8 月 3 日

公開日: 2022 年 8 月 3 日

Athena で、JDBC ドライバーのバージョン 2.0.32 がリリースされます。JDBC 2.0.32 ドライバーには、次の変更が含まれています。

  • Athena SDK に送信される User-Agent 文字列が、ドライバーのバージョン、JDBC 仕様のバージョン、認証プラグインの名前を含むように拡張されました。

  • CheckNonProxyHost パラメータに値が提供されていない場合にスローされる NullPointerException を修正しました。

  • BrowserSAML 認証プラグインでの login_url 解析に関する問題を修正しました。

  • UseProxyforIdp パラメータが true に設定された場合に発生するプロキシのホストの問題を修正しました。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「Athena での JDBC ドライバーの使用」を参照してください。

2022 年 8 月 1 日

公開日: 2022 年 8 月 1 日

Athena が Athena Query Federation SDK と Athena の事前構築済みデータソースコネクタの改善を発表しました。改善には次が含まれます。

  • 構造体の解析 – 特定の複雑な構造体がすべてのデータを表示できないという Athena Query Federation SDK の GlueFieldLexer の解析の問題を修正しました。この問題は、Athena Query Federation SDK 上に構築されたコネクタに影響を与えました

  • AWS Glue テーブル – AWS Glue テーブルの set および decimal の列タイプのサポートがさらに追加されました。

  • DynamoDB コネクタ – DynamoDB 属性名の大文字と小文字を無視する機能が追加されました。詳細については、GitHub の「Amazon Athena DynamoDB connector」(Amazon Athena DynamoDB コネクタ) ドキュメントの「disable_projection_and_casing」セクションを参照してください。

詳細については、GitHub の「Release v2022.30.2 of Athena Query Federation」(Athena Query Federation のリリース v2022.30.2) を参照してください。

2022 年 7 月 21 日

公開日: 2022 年 7 月 21 日

Athena コンソールで、パフォーマンスメトリクスとインタラクティブで視覚的なクエリ分析ツールを使用して、クエリを分析およびデバッグできるようになりました。クエリのパフォーマンスデータと実行の詳細は、クエリのボトルネックの特定、クエリの各ステージの演算子と統計の検査、ステージ間を流れるデータ量の追跡、クエリ述語の影響の検証に役立ちます。これで、次の操作を実行できます。

  • 1 回クリックするだけで、クエリの分散型および論理実行プランにアクセスできます。

  • ステージが実行される前に、各ステージでのオペレーションを詳しく確認します。

  • キュー、計画、実行の各段階で費やされた時間のメトリクスを使用して、完了したクエリのパフォーマンスを視覚化します。

  • クエリで処理および出力されたソースデータの行数と量に関する情報を取得します。

  • コンテキストで示され、インタラクティブなグラフとしてフォーマットされたクエリのきめ細かい実行の詳細を表示します。

  • ステージレベルの正確な実行の詳細を使用して、クエリを通じたデータの流れを理解します。

  • 新しい API を使用してプログラムでクエリパフォーマンスデータを分析し、クエリランタイム統計を取得します。これも本日リリースされました。

クエリでこれらの機能を使用する方法については、AWS YouTube チャンネルの動画のチュートリアル「Optimize Amazon Athena Queries with New Query Analysis Tools」(新しいクエリ分析ツールを使用して Amazon Athena クエリを最適化する) をご覧ください。

ドキュメントについては、「SQL クエリの実行プランの表示」および「完了したクエリの統計と実行の詳細の表示」を参照してください。

2022 年 7 月 11 日

公開日: 2022 年 7 月 11 日

SQL ステートメントを事前に準備することなく、パラメータ化されたクエリを Athena コンソールまたは API から直接実行できるようになりました。

疑問符形式のパラメータを含むクエリを Athena コンソールで実行すると、パラメータの値を直接入力することを促すプロンプトがユーザーインターフェイスで表示されるようになりました。これにより、クエリを実行するたびにクエリエディタでリテラル値を変更する必要がなくなります。

強化された query execution API を使用する場合、1 回の呼び出しで実行パラメータとその値を指定できるようになりました。

詳細については、このユーザーガイドの「パラメータ化されたクエリの使用」と AWS ビッグデータブログの記事「Use Amazon Athena parameterized queries to provide data as a service」(Amazon Athena のパラメータ化されたクエリを使用して Data as a Service (DaaS) を提供する) を参照してください。

2022 年 7 月 8 日

公開日: 2022 年 7 月 8 日

Athena は、次の修正と改善を発表しました。

  • クエリの失敗を引き起こしていた SageMaker エンドポイント (UDF) の DATE 列変換処理の問題を修正しました。

2022 年 6 月 6 日

公開日: 2022 年 6 月 6 日

Athena が JDBC ドライバーのバージョン 2.0.31 をリリース。JDBC 2.0.31 ドライバーには、次の変更が含まれています。

  • log4j 依存関係の問題 — log4j 依存関係によって引き起こされる「ドライバークラスが見つからない」エラーメッセージを解決しました。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「Athena での JDBC ドライバーの使用」を参照してください。

2022 年 5 月 25 日

公開日: 2022 年 5 月 25 日

Athena は、次の修正と改善を発表しました。

  • Iceberg のサポート

    • クロスリージョンクエリのサポートが導入されました。これにより、使用している AWS リージョンとは異なる AWS リージョンにある Iceberg テーブルをクエリできるようになりました。

    • サーバー側暗号化設定のサポートが導入されました。これにより、Amazon S3 での Iceberg 書き込み操作からのデータの暗号化に SSE-S3/SSE-KMS を使用できるようになりました。

    Athena での Apache Iceberg の使用に関する詳細については、「Iceberg テーブルの使用」を参照してください。

  • JDBC 2.0.30 ドライバーリリース

    Athena 用の JDBC 2.0.30 ドライバーでは、以下の点が改善されました。

    • パラメータ化されたプリペアドステートメントに影響を及ぼしていたデータ競合の問題を修正。

    • Gradle ビルド環境で発生していたアプリケーションの起動問題を修正。

    JDBC 2.0.30 ドライバー、リリースノート、およびドキュメントをダウンロードするには、「Athena での JDBC ドライバーの使用」を参照してください。

2022 年 5 月 6 日

公開日: 2022 年 5 月 6 日

Athena 用の JDBC 2.0.29 ドライバー と ODBC 1.1.17 ドライバーがリリースされました。

これらのドライバーには、以下の変更が含まれます。

  • SAML プラグインブラウザの起動プロセスを更新しました。

これらの変更についての詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「Athena での JDBC ドライバーの使用」および「ODBC を使用した Amazon Athena への接続」を参照してください。

2020 年 4 月 22 日

公開日: 2022 年 4 月 22 日

Athena は、次の修正と改善を発表しました。

  • 次の条件が満たされたときにパーティションキャッシュで発生していた、パーティションインデックスとフィルタリング機能の問題を修正しました。

    • テーブルの AWS Glue テーブルプロパティで partition_filtering.enabled キーが true に設定されている。

    • 同じテーブルが異なるパーティションフィルター値で複数回使用されている。

2022 年 4 月 21 日

公開日: 2022 年 4 月 21 日

Amazon Athena を使用して、Google BigQuery、Azure Synapse、Snowflake などの新しいデータソースに対してフェデレーティッドクエリを実行できるようになりました。新しいデータソースコネクタには、次のものがあります。

Athena でサポートされるデータソースの完全なリストについては、「Athena データソースコネクタの使用」を参照してください。

使用可能なソースを参照してデータに接続しやすくなるように、Athena コンソールの新しくなった [Data Sources] (データソース) 画面から使用可能なコネクタを検索、並べ替え、およびフィルターできるようになりました。

フェデレーティッドソースに対するクエリについては、「Amazon Athena 横串検索の使用」および「フェデレーティッドクエリの記述」を参照してください。

2022 年 4 月 13 日

公開日: 2022 年 4 月 13 日

Athena は JDBC ドライバーのバージョン 2.0.28 をリリースします。JDBC 2.0.28 ドライバーには、次の変更が含まれています。

  • JWT のサポート - ドライバーが、認証に使用される JSON ウェブトークン (JWT) をサポートするようになりました。JDBC ドライバーでの JWT の使用については、JDBC ドライバーページからダウンロードできるインストールと設定のガイドを参照してください。

  • Log4j ライブラリの更新 - JDBC ドライバーが、次の Log4j ライブラリを使用するようになりました。

    • Log4j-API 2.17.1 (以前は 2.17.0)

    • Log4j-core 2.17.1 (以前は 2.17.0)

    • Log4j-jcl 2.17.2

  • その他の改善点 - 新しいドライバーには、以下の改善とバグ修正も含まれています。

    • JDBC を通じて Athena 準備済みステートメント機能を使用できるようになりました。準備済みステートメントについては、「パラメータ化されたクエリの使用」を参照してください。

    • 中国リージョンで Athena JDBC SAML フェデレーションが機能するようになりました。

    • その他の小さな改善。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「Athena での JDBC ドライバーの使用」を参照してください。

2022 年 3 月 30 日

公開日: 2022 年 3 月 30 日

Athena は、次の修正と改善を発表しました。

  • クロスリージョンクエリ— Athena を使用して、アジアパシフィック (香港)、中東 (バーレーン)、アフリカ (ケープタウン)、欧州 (ミラノ) を含む AWS リージョン 全体で Amazon S3 バケット内のデータをクエリできるようになりました。

2022 年 3 月 18 日

公開日: 2022 年 3 月 18 日

Athena は、次の修正と改善を発表しました。

  • 動的フィルタリング動的フィルタリングは、対応するテーブルの各レコードにフィルタを効率的に適用することで、整数列に対して改善されました。

  • Iceberg – 2GB を超える Iceberg Parquet ファイルを書き込むときにエラーが発生する問題を修正しました。

  • 非圧縮出力CREATE TABLE ステートメントが、非圧縮ファイルの書き込みをサポートするようになりました。非圧縮ファイルを書き込むには、次の構文を使用します。

    • CREATE TABLE (テキストファイルまたは JSON) – TBLPROPERTIES で、write.compression = NONE を指定します。

    • CREATE TABLE (Parquet) – TBLPROPERTIES で、parquet.compression = UNCOMPRESSED を指定します。

    • CREATE TABLE (ORC) – TBLPROPERTIES で、orc.compress = NONE を指定します。

  • 圧縮 – あるフォーマットで圧縮されたファイルを作成したが、デフォルト以外の圧縮方法を使用したときに、別の圧縮形式のファイル拡張子を使用したテキストファイルテーブルの挿入に関する問題を修正しました。

  • Avro – Avro ファイルから固定タイプの小数点を読み取るときに発生する問題を修正しました。

2022 年 3 月 2 日

公開日: 2022 年 3 月 2 日

Athena は、次の機能と改善点を発表しました。

  • クエリ結果の場所バケットで ACL が有効になっている場合、クエリ結果に対するフルコントロールアクセスを Simple Storage Service (Amazon S3) バケット所有者に付与できるようになりました。詳細については、「クエリ結果の場所の指定」を参照してください。

  • 既存の名前付きクエリを更新できるようになりました。詳細については、「保存されたクエリの使用」を参照してください。

2022 年 2 月 23 日

公開日: 2022 年 2 月 23 日

Athena は、次の修正とパフォーマンス改善を発表しました。

  • パフォーマンスを向上させ、メモリエラーを削減するためのメモリ処理の改善。

  • Athena は、ストライプフッターに保存されたタイムゾーン情報で ORC タイムスタンプ列を読み取り、タイムゾーン (UTC) を持つ ORC ファイルをフッターに書き込むようになりました。これは、読み込む ORC ファイルが UTC 以外のタイムゾーン環境で作成された場合にのみ、ORC タイムスタンプ読み取りの動作に影響します。

  • 十分最適でないクエリプランが発生するシンボリック リンクテーブルサイズの誤見積もりを修正しました。

  • 水平分解ビューを Hive メタストア データソースから Athena コンソールでクエリできるようになりました。

  • Amazon S3 の読み取りエラーメッセージが改善され、より詳細な Simple Storage Service (Amazon S3) のエラーコード情報が含まれるようになりました。

  • ORC 形式の出力ファイルで Apache Hive 3.1 との互換性がなくなる問題を修正しました。

  • 一部の DML および DDL クエリで、引用符付きのテーブル名が失敗する問題を修正しました。

2022 年 2 月 15 日

公開日: 2022 年 2 月 15 日

Amazon Athena はアクティブな DML クエリクォータをすべての AWS リージョンで増加させました。アクティブなクエリには、実行中のクエリとキューに登録されたクエリの両方が含まれます。この変更により、これまでよりも多くの DML クエリをアクティブ状態にできるようになりました。

Athena のサービスクォータの詳細については、「Service Quotas」を参照してください。Athena を使用するリージョンのクエリクォータについては、AWS 全般リファレンスAmazon Athena エンドポイントとクォータを参照してください。

クォータの使用状況をモニタリングするには、CloudWatch の使用状況メトリクスを使用できます。Athena は、AWS/Usage 名前空間に ActiveQueryCount メトリクスを公開します。詳細については、「Athena の使用状況に関するメトリクスのモニタリング」を参照してください。

使用状況を確認したら、Service Quotas コンソールを使用して、クォータの引き上げをリクエストできます。以前にアカウントのクォータの引き上げをリクエストしたことがある場合は、新しいデフォルトのアクティブな DML クエリクォータを超えた場合にもリクエストされたクォータが適用されます。それ以外の場合は、すべてのアカウントで新しいデフォルトが使用されます。

2022 年 2 月 14 日

公開日: 2022 年 2 月 14 日

このリリースでは、Athena GetQueryExecution API アクションの AthenaError レスポンスオブジェクトに ErrorType サブフィールドが追加されました。

既存の ErrorCategory フィールドは、失敗したクエリの一般的なソース (システム、ユーザー、またはその他) を示しますが、新しい ErrorType フィールドには、発生したエラーに関するより詳細な情報が表示されます。両方のフィールドの情報を組み合わせて、クエリが失敗した原因に関するインサイトを把握します。

詳細については、「Athena エラーカタログ」を参照してください。

2022 年 2 月 9 日

公開日: 2022 年 2 月 9 日

古い Athena コンソールは利用できなくなりました。Athena の新しいコンソールは、以前のコンソールの機能をすべてサポートしています。それでいて使いやすく、最新のインターフェースを備えており、新機能によりクエリの開発、データの分析、使用状況管理の経験が向上します。新しい Athena コンソールを使用するには、https://console.aws.amazon.com/athena にアクセスします。

2022 年 2 月 8 日

公開日: 2022 年 2 月 8 日

バケット所有者 — 追加のセキュリティ対策として、クエリ結果を出力する場所となる Athena のバケットの、所有者 AWS アカウント の ID を、オプションで指定できるようになりました。クエリ結果でのバケット所有者のアカウント ID が、ここで指定したアカウント ID と一致しない場合、Amazon S3 のアクセス許可エラーにより、バケットに出力できません。この設定は、クライアントレベルまたはワークグループレベルで行えます。

詳細については、「クエリ結果の場所の指定」を参照してください。

2022 年 1 月 28 日

公開日: 2022 年 1 月 28 日

Athena では、次のエンジン機能の強化点を発表しました。

  • Apache Hudi — Hudi Merge on Read (MoR) テーブルに対するスナップショットクエリで、INT64 データ型のタイムスタンプ列の読み込みが可能になりました。

  • UNION クエリ — パフォーマンスが向し、同じテーブルを何度もスキャンするような特定の UNION クエリの、データスキャンを減らしました。

  • クエリの分離 — フィルターの各パーティション列に対して、分離値のみを含むクエリの、パフォーマンスが向上しました。

  • パーティション射影の強化

    • injected タイプの列に対するフィルター条件として、複数の分離値が許可されるようになりました。詳細については、「挿入型」を参照してください。

    • 分離値のみがフィルターに含まれ、CHARVARCHAR のような文字をベースとしたタイプの列の、パフォーマンスが向上しました。

2022 年 1 月 13 日

公開日: 2022 年 1 月 13 日

Athena 用の JDBC 2.0.27 ドライバー と ODBC 1.1.15 ドライバー がリリースされました。

JDBC 2.0.27 ドライバーには、次の変更が含まれています。

  • 外部カタログを取得するようにドライバが更新されました。

  • 拡張ドライバのバージョン番号は、Athena API コールの一部として、user-agent 文字列に含まれます。

ODBC 1.1.15 ドライバーには、次の変更が含まれています。

  • SQLParamData() への 2 回目の呼び出しに関する問題を修正しました。

これらの変更についての詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「Athena での JDBC ドライバーの使用」および「ODBC を使用した Amazon Athena への接続」を参照してください。

Athena リリースノート (2021 年)

2021 年 11 月 30 日

公開日: 2021 年 11 月 30 日

Amazon Athena ユーザーは AWS Lake Formation を使用してアクセス許可をきめ細かく設定し、ACID 準拠のテーブルから読み取りできます。Amazon Athena では、Amazon S3 ベースのデータレイク内のデータを簡単に分析できるようになり、アクセス許可を与えられたデータにのみユーザーがアクセスできるようにします。ACID 機能を使用すると、基になるデータに複雑な変更が発生した場合でも、クエリを信頼できるようになります。

[Lake Formation data filtering] (Lake Formation データのフィルタリング) を使用すると、列、行、およびセルのレベルでアクセス許可を付与することで、Amazon S3 データレイク内のテーブルを保護できます。これらのアクセス許可は、Athena ユーザーがデータをクエリする際に適用されます。この細かい制御レベルのおかげで、機密情報を粗雑な方法でマスキングしてしまうことで、分析の邪魔になることもなく、機密情報へのアクセスをユーザーに付与できます。さらに Lake Formation で管理されたテーブルでは、同時に複数のユーザーがテーブルで Simple Storage Service (Amazon S3) データオブジェクトの追加や削除を行っていても、Athena ユーザーがデータをクエリできます。

詳細については、「Athena ACID トランザクションの使用」および「Governed Tables の使用」を参照してください。

2021 年 11 月 26 日

公開日: 2021 年 11 月 26 日

Athena は、Athena ACIDトランザクションのパブリックプレビューを発表しました。Athena の SQL データ操作言語 (DML) に書込み、削除、更新、およびタイムトラベルの操作を追加しました。Athena ACID トランザクションにより、複数のユーザーが、Amazon S3 データに対して信頼性の高い行レベルの変更を、同時に行えます。Apache Iceberg テーブルフォーマット上に構築された Athena ACID トランザクションは、Amazon EMRApache Spark など、Iceberg テーブルフォーマットをサポートしている他のサービスやエンジンと互換性があります。

使い慣れた SQL 構文で Athena ACID トランザクションを行うことで、ビジネスや規制に関するデータの更新が簡素化されます。例えば、データの消去リクエストに応答する場合は、SQL の DELETE オペレーションを実行します。手動によるレコードの修正には、単一の UPDATE ステートメントを使用します。また、最近削除されたデータを回復する場合は、SELECT ステートメントにより、タイムトラベルクエリを発行します。Athena コンソール、API オペレーション、ODBC および JDBC ドライバー経由で、Athena のトランザクションを利用できます。

詳細については、「Athena ACID トランザクションの使用」を参照してください。

2021 年 11 月 24 日

公開日: 2021 年 11 月 24 日

Athena は、ZStandard で圧縮された ORC、Parquet、およびテキストファイルのデータに対する読み取りと書き込みをサポートすると発表しました。Athena では、ZStandard で圧縮されたデータを書き込むときに、ZStandard 圧縮レベル 3 を使用します。

Athena でのデータ圧縮の詳細については、「Athena での圧縮のサポート」を参照してください。

2021 年 11 月 22 日

公開日: 2021 年 11 月 22 日

これで Amazon Athena コンソールから AWS Step Functions ワークフローを管理する際に、スケーラブルなデータを処理するパイプラインの構築、カスタムのビジネスロジックに基づくクエリの実行、管理タスクやアラートタスクの自動化などが容易になります。

アップグレードされた Athena コンソール に Step Functions が統合され、これにより Athena を起動するステートマシンのインタラクティブなワークフロー図を表示できます。開始するには、左のナビゲーションパネルから [Workflows] (ワークフロー) を選択します。Athena クエリを持つ既存のステートマシンがある場合は、ステートマシンを選択して、インタラクティブなワークフロー図を表示します。Step Functions を初めて使用する場合は、まず Athena コンソールからサンプルプロジェクトを起動し、ユースケースに合わせてカスタマイズします。

詳細については、Amazon Athena と AWS Step Functions を使用して ETL パイプラインの構築とオーケストレーションを行うを参照するか、Step Functions ドキュメントを参照してください。

2021 年 11 月 18 日

公開日: 2021 年 11 月 18 日

Athena は、新機能と改善点を発表しました。

  • 次の例で示すような、DISTINCTORDER BY、またその両方を含む集計クエリの、ディスクへの流出をサポートします。

    SELECT array_agg(orderstatus ORDER BY orderstatus) FROM orders GROUP BY orderpriority, custkey
  • DISTINCT を使用するクエリの、メモリ処理に関する問題を修正しました。DISTINCT クエリを使用した際に、「Query exhausted resources at this scale factor」(このスケールファクターにより、クエリがリソースを使い果たしました) のようなメッセージが表示されないようにするには、DISTINCT のカーディナリティが低い行を選択するか、クエリのデータサイズを減らします。

  • 特定の列を指定しない SELECT COUNT(*) クエリで、行バッファリングなしでカウントのみを保持することで、パフォーマンスとメモリ使用率が向上しました。

  • 次の文字列関数が導入されました。

    • translate(source, from, to)from の文字列を、対応する to の文字列に置き換えた、source 文字列を返します。from の文字列が重複していた場合、最初の文字列だけが使用されます。from 文字列の中に source の文字が無い場合、source の文字は翻訳されずにコピーされます。from 文字列にあるマッチした文字のインデックスが、to 文字列よりも長い場合、その文字は結果として返される文字列から省かれます。

    • concat_ws(string0, array(varchar))string0 を区切り文字として使用して、配列の要素を連結し、その結果を返します。string0 が null である場合、戻り値は null です。配列内の null 値はスキップされます。

  • 欠落している struct のサブフィールドにアクセスしようとすると、クエリが失敗してしまうバグを修正しました。欠落しているサブフィールドについては、クエリが null を返すようになりました。

  • 小数データ型のハッシュが矛盾する問題を修正しました。

  • パーティション内の列が多すぎると、リソースを使い果たしてしまう問題を修正しました。

2021 年 11 月 17 日

公開日: 2021 年 11 月 17 日

Amazon Athena がパーティションのインデックス作成をサポートし、AWS Glue Data Catalog でパーティション化されたテーブルに対するクエリを高速化しました。

パーティション化されたテーブルをクエリする場合、Athena が利用可能なテーブルパーティションを取得し、クエリに関係のあるサブセットをフィルタリングします。新しいデータとパーティションが追加されると、パーティションの処理にかかる時間が長くなり、クエリの実行時間も長くなります。Athena がAWS Glue パーティションインデックスをサポートし、パーティション処理が最適化され、高度にパーティション化されたテーブルでのクエリパフォーマンスが向上しました。

詳細については、「AWS Glue パーティションのインデックス作成とフィルタリング」を参照してください。

2021 年 11 月 16 日

公開日: 2021 年 11 月 16 日

新しくなって改善された Amazon Athenaコンソールが、Athena を利用可能な AWS 商用リージョンと GovCloud リージョンで、一般利用可能になりました。Athena の新しいコンソールは、以前のコンソールの機能をすべてサポートしています。それでいて使いやすく、最新のインターフェースを備えており、新機能によりクエリの開発、データの分析、使用状況管理の経験が向上します。これで、次の操作を実行できます。

  • クエリタブバーが再設計され、複数のクエリタブを並べ替え、移動し、閉じることが可能になりました。

  • SQL およびテキストの書式設定が改善され、クエリの読み取りと編集がより簡単になりました。

  • 完全な結果セットのダウンロードに加え、クエリ結果をクリップボードにコピーできるようになりました。

  • クエリ履歴、保存されたクエリ、ワークグループを並べ替え、表示または非表示にする列を選択できるようになりました。

  • シンプルなインターフェイスのおかげで、データソースとワークグループをより少ないクリック数で設定できます。

  • クエリ結果、クエリ履歴、行の折り返しなどの表示に関するプリファレンスを設定できます。

  • キーボードショートカットが新しく改善され、また製品ドキュメントが組み込まれたことにより、生産性を向上できます。

本日の発表で、再設計されたコンソールがデフォルトの設定になりました。あなたの体験についてお伝え頂ける場合は、コンソールの左下隅にある [Feedback] (フィードバック) を選択してください。

必要な場合は、AWS アカウント にログインし、Amazon Athena を選択してから、左のナビゲーションパネルにある [New Athena experience] (新しい Athena エクスペリエンス) の選択を解除すると、以前のコンソールを使用できます。

2021 年 11 月 12 日

公開日: 2021 年 11 月 12 日

Amazon Athena を使用して、自分以外の AWS アカウントにあるデータソースに対し、フェデレーティッドクエリを実行できるようになりました。今日までは、このデータをクエリして、データをクエリしたユーザーと同じ AWS アカウント を使用するには、データソースとそのコネクタが必要でした。

データ管理者としては、データコネクタをデータアナリストのアカウントと共有することで、クロスアカウントのフェデレーティッドクエリを有効にできます。データアナリストとしては、データ管理者が共有してくれたデータコネクタをアカウントに追加できます。発信元アカウントのコネクタに対する設定変更は、共有されたコネクタに自動的に適用されます。

クロスアカウントフェデレーティッドクエリの有効化については、「クロスアカウントのフェデレーションクエリの有効化」を参照してください。フェデレーティッドソースに対するクエリについては、「Amazon Athena 横串検索の使用」および「フェデレーティッドクエリの記述」を参照してください。

2021 年 11 月 2 日

公開日: 2021 年 11 月 2 日

Athena で EXPLAIN ANALYZE ステートメントを使用して、SQL クエリで配信された実行プランと、それぞれのオペレーションコストを表示できるようになりました。

詳細については、「Athena での EXPLAIN および EXPLAIN ANALYZE の使用」を参照してください。

2021 年 10 月 29 日

公開日: 2021 年 10 月 29 日

Athena が JDBC 2.0.25 ドライバーと ODBC 1.1.13 ドライバーをリリースし、それぞれの機能と改善点を発表します。

JDBC ドライバーおよび ODBC ドライバー

Athena 用の JDBC 2.0.25 ドライバー と ODBC 1.1.13 ドライバー がリリースされました。どちらのドライバーも、任意の SAML 2.0 プロバイダーで動作するように構成可能な、ブラウザでの SAML 多要素認証をサポートしています。

JDBC 2.0.25 ドライバーには、次の変更が含まれています。

  • ブラウザでの SAML 認証をサポート。ドライバーには、任意の SAML 2.0 プロバイダーで動作するように構成可能な、ブラウザの SAML プラグインが含まれています。

  • AWS Glue API コールのサポート。GlueEndpointOverride パラメータを使用して、AWS Glue エンドポイントをオーバーライドできます。

  • com.simba.athena.amazonaws クラスパスを、com.amazonaws に変更しました。

ODBC 1.1.13 ドライバーには、次の変更が含まれています。

  • ブラウザでの SAML 認証をサポート。ドライバーには、任意の SAML 2.0 プロバイダーで動作するように構成可能な、ブラウザの SAML プラグインが含まれています。ODBC ドライバーでブラウザの SAML プラグインを使用する例については、「ODBC、SAML 2.0、および Okta ID プロバイダーを使用したシングルサインオンの設定」を参照してください。

  • ADFS、Azure AD、または Browser Azure AD を認証に使用するときに、ロールのセッション期間を設定できるようになりました。

この詳細や、その他の変更について確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「Athena での JDBC ドライバーの使用」および「ODBC を使用した Amazon Athena への接続」を参照してください。

特徴と改善点

Athena は、次の機能と改善点を発表しました。

  • 特定のケースにおいて、テーブルスキャンが重複して行われることを回避するために、新しい最適化ルールが導入されました。

2021 年 10 月 4 日

公開日: 2021 年 10 月 4 日

Athena は、次の機能と改善点を発表しました。

  • SQL OFFSET — SQLの SELECT ステートメントで、OFFSET 句がサポートされるようになりました。詳細については、「SELECT」を参照してください。

  • CloudWatch の使用状況メトリクス — Athena が AWS/Usage 名前空間で、ActiveQueryCount メトリクスを発行するようになりました。詳細については、「Athena の使用状況に関するメトリクスのモニタリング」を参照してください。

  • クエリ実行計画 — まれに、クエリ実行計画でタイムアウトを引き起こす可能性のあるバグを修正しました。

2021 年 9 月 16 日

公開日: 2021 年 9 月 16 日

Athena は、次の新機能と改善点を発表しました。

機能

  • Hudi テーブルで Apache Hudi Metadata Listing Feature を利用できるようになり、Amazon S3 のオーバーヘッドが削減され、パーティション化されたテーブルに対するクエリ時間が短縮されます。Athena での Apache Hudi の使用に関する詳細については、「Athena を使用した Apache Hudi データセットのクエリ」を参照してください。

  • CTAS において、テキストファイルの指定と、write_compression テーブルプロパティを使用した圧縮 JSON の指定をサポートしました。Parquet 形式および ORC 形式の場合でも、CTAS で write_compression プロパティを指定できます。詳細については、「CTAS テーブルのプロパティ」を参照してください。

  • テキストファイルと JSON ファイルへの書き込みで、BZIP2 圧縮形式がサポートされました。Athena での圧縮形式の詳細については、「Athena での圧縮のサポート」を参照してください。

改良点

  • UDF の Lambda 関数への ID 情報送信が、失敗してしまうバグを修正しました。

  • 分離フィルター条件での、述語プッシュダウンの問題を修正しました。

  • 小数型のハッシュの問題を修正しました。

  • 不要な統計を収集していた問題を修正しました。

  • 一貫性のないエラーメッセージを削除しました。

  • ワーカーノードで動的パーティションプルーニングを適用し、ブロードキャストジョインのパフォーマンスが向上しました。

  • フェデレーティッドクエリ

    • フェデレーティッドクエリ内で CONSTRAINT_VIOLATION エラーの発生を削減するために設定を変更しました。

2021 年 9 月 15 日

公開日: 2021 年 9 月 15 日

再設計された Amazon Athena コンソール (プレビュー) を使用できるようになりました。新しい Athena JDBC ドライバーがリリースされました。

Athena コンソールのプレビュー

Athena が利用可能であれば、どの AWS リージョン からでも再設計された Amazon Athena コンソール (プレビュー) を使用できるようになりました。新しいコンソールは、既存のコンソールのすべての機能をサポートしていますが、より使いやすく、最新のインターフェイスをサポートしています。

新しいコンソールに切り替えるには、AWS アカウント にログインして、Amazon Athena を選択します。AWS コンソールのナビゲーションバーから、[Switch to the new console] (新しいコンソールに切り替える) を選択します。デフォルトのコンソールに戻るには、左のナビゲーションパネルにある [New Athena experience] (新しい Athena エクスペリエンス) の選択を解除します。

新しいコンソールのご利用を開始してください。左下隅にある [Feedback] (フィードバック) から、あなたの体験についてお伝えください。

Athena JDBC ドライバー 2.0.24

Athena は、Athena 用 JDBC ドライバーのバージョン 2.0.24 の利用開始を発表しました。このリリースでは、すべての認証情報プロバイダのプロキシサポートが更新されます。ドライバーは、NonProxyHosts 接続プロパティでサポートされていない、すべてのホストのプロキシ認証をサポートするようになりました。

便宜上 このリリースには、AWS SDK が付属したJDBC ドライバーと、付属しないドライバーの両方のダウンロードが含まれています。この JDBC ドライバーのバージョンには、AWS-SDK と Athena JDBC ドライバーの両方がプロジェクトに埋め込まれています。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「Athena での JDBC ドライバーの使用」を参照してください。

2021 年 8 月 31 日

公開日: 2021 年 8 月 31 日

Athena では、次の機能強化とバグ修正が行われました。

  • Athena フェデレーション機能の強化 — Athena は、Athena Query Federation SDK の一部として、マップタイプのサポートと、複合型に対するサポートを強化しました。このバージョンには、メモリの強化とパフォーマンスの最適化も含まれています。

  • 新しいエラーカテゴリ — エラーメッセージに、USERSYSTEM のエラーカテゴリが導入されました。これらのカテゴリは、自分で修正が可能なエラー (USER) なのか、Athena サポートから支援を受ける必要があるエラー (SYSTEM) なのかを区別するのに役立ちます。

  • フェデレーティッドクエリのエラーメッセージ — フェデレーティッドクエリ関連エラーで、USER_ERROR のカテゴリー分けを更新しました。

  • JOIN — ディスクへの流出関連のバグとメモリの問題を修正し、JOIN オペレーションにおけるパフォーマンスを向上させ、メモリエラーを減らします。

2021 年 8 月 12 日

公開日: 2021 年 8 月 12 日

Athena 用の ODBC 1.1.12 ドライバーがリリースされました。このバージョンでは、SQLPrepare()SQLGetInfo()、および EndpointOverride 関連の問題が修正されています。

新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「ODBC を使用した Amazon Athena への接続」を参照してください。

2021 年 8 月 6 日

公開日: 2021 年 8 月 6 日

Amazon Athena では、アジアパシフィック (大阪) リージョンで Athena とその機能が利用可能になりました。

このリリースでは、アジアパシフィックでの Athena の提供が拡張され、アジアパシフィック (香港)、アジアパシフィック (ムンバイ)、アジアパシフィック (大阪)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、およびアジアパシフィック (東京) も含まれるようになりました。これらのリージョンや他のリージョンで利用可能な AWS のサービス の詳細な一覧については、「AWS リージョン 別のサービス表」を参照してください。

2021 年 8 月 5 日

公開日: 2021 年 8 月 5 日

UNLOAD ステートメントを使用して、SELECT クエリの出力を PARQUET、ORC、AVRO、および JSON 形式に書き込むことができます。

詳細については、「UNLOAD」を参照してください。

2021 年 7 月 30 日

公開日: 2021 年 7 月 30 日

Athena では、次の機能強化とバグ修正が行われました。

  • 動的フィルタリングとパーティションプルーニング - 次の例のように、これらの改善によってパフォーマンスが向上し、特定のクエリでスキャンされるデータ量が削減します。

    この例では、Table_B がパーティション化されていないテーブルで、ファイルサイズが 20Mb 未満であると想定しています。このようなクエリの場合、Table_A から読み込まれるデータがより少なくなり、クエリがより迅速に完了します。

    SELECT * FROM Table_A JOIN Table_B ON Table_A.date = Table_B.date WHERE Table_B.column_A = "value"
  • ORDER BY と LIMIT、DISTINCT と LIMIT - ORDER BY または DISTINCT に続いて LIMIT 句を使用するクエリのパフォーマンスが改善されました。

  • S3 Glacier Deep Archive ファイル - Athena が S3 Glacier Deep Archive ファイルと S3 Glacier 以外のファイルが混在するテーブルをクエリする場合、S3 Glacier Deep Archive ファイルをスキップするようになりました 以前は、これらのファイルをクエリの場所から手動で移動する必要がありました。これを行わないと、クエリが失敗します。Athena を使用して S3 Glacier Deep Archive ストレージ内のオブジェクトをクエリする場合は、それらを元に戻す必要があります。詳細については、Amazon S3 ユーザーガイドの「アーカイブされたオブジェクトの復元」を参照してください。

  • CTAS bucketed_by テーブルプロパティによって作成された空のファイルが正しく暗号化されなかったバグを修正しました。

2021 年 7 月 21 日

公開日: 2021 年 7 月 21 日

2021 年 7 月にリリースされた Microsoft Power BI Desktop では、Amazon Athena のネイティブのデータソースコネクタを使用してレポートとダッシュボードを作成できます。Amazon Athena のコネクタは、Power BI の標準コネクタとして利用できます。また、DirectQuery をサポートし、Power BI ゲートウェイを介した大規模なデータセットの分析とコンテンツの更新を可能にします。

コネクタは、既存の ODBC データソース名 (DSN) を使用して Athena に接続してクエリを実行するため、Athena ODBC ドライバーが必要です。最新の ODBC ドライバーをダウンロードする方法は、「ODBC を使用した Amazon Athena への接続」を参照してください。

詳細については、「Amazon Athena Power BI コネクタの使用」を参照してください。

2021 年 7 月 16 日

公開日: 2021 年 7 月 16 日

Amazon Athena の Apache Hudi との統合を更新しました。Hudi は、Amazon S3 データレイクの増分データ処理を簡素化するのに使用されるオープンソースのデータ管理フレームワークです。統合を更新することにより、Amazon EMR、Apache Spark、Apache Hive、またはその他の互換性のあるサービスで管理される Hudi 0.8.0 テーブルを、Athena を使用してクエリできます。さらに、Athena は、読み取り時マージ (MoR) テーブルのスナップショットクエリと、ブートストラップされたテーブルの読み取りサポートの 2 つの追加機能をサポートするようになりました。

Apache Hudi は、変更データキャプチャ (CDC) パイプラインの開発の簡素化、GDPR 駆動の更新と削除への準拠、およびデータの挿入とイベントの更新を必要とするセンサーやデバイスからのストリーミングデータの管理に役立つレコードレベルのデータ処理を提供します。0.8.0 リリースでは、データをコピーせずに、大きな Parquet テーブルを Hudi に移行しやすくなり、Athena を介してクエリおよび分析できるようになります。Athena の新しいスナップショットクエリのサポートを使用して、ストリーミングテーブルの更新をほぼリアルタイムで表示できます。

Athena での Hudi の使用の詳細については、「Athena を使用した Apache Hudi データセットのクエリ」を参照してください。

2021 年 7 月 8 日

公開日: 2021 年 7 月 8 日

Athena 用の ODBC 1.1.11 ドライバーがリリースされました。ODBC ドライバーが JSON ウェブトークン (JWT) を使用して接続を認証できるようになりました。Linux では、Workgroup プロパティのデフォルト値は Primary に設定されています。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「ODBC を使用した Amazon Athena への接続」を参照してください。

2021 年 7 月 1 日

公開日: 2021 年 7 月 1 日

2021年7月1日、プレビューワークグループの特別な取り扱いが終了しました。AmazonAthenaPreviewFunctionality ワークグループの名前は保持されますが、特別なステータスはなくなります。引き続き AmazonAthenaPreviewFunctionality ワークグループを使用して、クエリを表示、変更、整理、実行することができます。ただし、以前プレビューに含まれていた機能を使用するクエリには、標準の Athena 請求条件が適用されます。請求については、「Amazon Athena の料金」を参照してください。

2021 年 6 月 23 日

公開日: 2021 年 6 月 23 日

Athena 用の JDBC 2.0.23 ドライバー と ODBC 1.1.10 ドライバー がリリースされました。どちらのドライバーも、読み取り性能とサポートが向上し、EXPLAIN ステートメントおよびパラメータ化されたクエリをサポートしています。

EXPLAIN ステートメントは、SQL クエリの論理実行計画または分散実行計画を示します。パラメータ化されたクエリを使用すると、実行時に指定された異なる値を使用して、同じクエリを複数回使用できます。

JDBC リリースでは、アクティブディレクトリフェデレーションサービス 2019 のサポートと、AWS STS 用のカスタムエンドポイント優先オプションが追加されています。ODBC リリースでは、IAM プロファイル認証情報の問題を修正しています。

詳細を確認し、新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「Athena での JDBC ドライバーの使用」および「ODBC を使用した Amazon Athena への接続」を参照してください。

2021 年 5 月 12 日

公開日: 2021 年 5 月 12 日

Amazon Athena を使用して、所有するアカウント以外のアカウントから AWS Glue を登録できるようになりました。AWS Glue に必要な IAM アクセス許可を設定したら、Athena を使用してクロスアカウントクエリを実行できます。

詳細については、「別のアカウントからの AWS Glue Data Catalog の登録」および「AWS Glue データカタログへのクロスアカウントアクセス」を参照してください。

2021 年 5 月 10 日

公開日: 2021 年 5 月 10 日

Athena 用の ODBC ドライバーバージョン1.1.9.1001 がリリースされました。このバージョンでは、Azure Active Directory (AD) を使用した際に発生する BrowserAzureAD 認証タイプの問題を修正しています。

新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「ODBC を使用した Amazon Athena への接続」を参照してください。

2021 年 5 月 5 日

公開日: 2021 年 5 月 5 日

横串検索で Amazon Athena Vertica コネクタを使用して、Athena から Vertica データソースをクエリできるようになりました。例えば、Vertica 上のデータウェアハウス、および Amazon S3 内のデータレイクに対して分析クエリを実行できます。

Athena Vertica コネクタをデプロイするには、AWS Serverless Application Repository の「AthenaVerticaConnector」ページを参照してください。

Amazon Athena Vertica コネクタは、Lambda 環境変数を使用して、いくつかの設定オプションを公開します。設定オプション、パラメータ、接続文字列、デプロイ、および制限については、GitHub の「Amazon Athena Vertica Connector」を参照してください。

Vertica コネクタの使用に関する詳細については、AWS ビッグデータブログの「Athena 横串検索 SDK を使用して Amazon Athena で Vertica データソースをクエリする」を参照してください。

2021 年 4 月 30 日

公開日: 2021 年 4 月 30 日

Athena 用の JDBC ドライバー 2.0.21 と ODBC ドライバー 1.1.9 がリリースされました。両方のリリースで、Azure Active Directory (AD) での SAML 認証と、PingFederate での SAML 認証がサポートされています。JDBC リリースでは、パラメータ化されたクエリもサポートされています。Athena でのパラメータ化されたクエリの詳細については、「パラメータ化されたクエリの使用」を参照してください。

新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「Athena での JDBC ドライバーの使用」および「ODBC を使用した Amazon Athena への接続」を参照してください。

2021 年 4 月 29 日

公開日: 2021 年 4 月 29 日

Amazon Athena が、中国 (北京) および中国 (寧夏) リージョンでの Athena エンジンバージョン 2 の提供開始を発表しました。

Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。

2021 年 4 月 26 日

公開日: 2021 年 4 月 26 日

Athena エンジンバージョン 2 のウィンドウ値関数が IGNORE NULLSRESPECT NULLS をサポートするようになりました。

詳細については、Presto ドキュメントの「Value Functions」を参照してください。

2021 年 4 月 21 日

公開日: 2021 年 4 月 21 日

Amazon Athena が欧州 (ミラノ) およびアフリカ (ケープタウン) リージョンでの Athena エンジンバージョン 2 の提供開始を発表しました。

Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。

2021 年 4 月 5 日

公開日: 2021 年 4 月 5 日

EXPLAIN ステートメント

Athena で EXPLAIN ステートメントを使用して、SQL クエリの実行プランを表示できるようになりました。

詳細については、「Athena での EXPLAIN および EXPLAIN ANALYZE の使用」および「Athena EXPLAIN ステートメントの結果について」を参照してください。

SQL クエリでの SageMaker 機械学習モデル

Amazon SageMaker を使用した機械学習モデル推論が、Amazon Athena で一般公開されました。SQL クエリで機械学習モデルを使用して、SQL クエリで関数を呼び出すことによる異常検知、カスタマーコーホート分析、および時系列予測などの複雑なタスクを簡素化します。

詳細については、「Machine Learning (ML) with Amazon Athena の使用」を参照してください。

ユーザー定義関数 (UDF)

ユーザー定義関数 (UDF) が Athena で一般公開されました。UDF を使用して、単一の SQL クエリでレコードまたはレコードのグループを処理するカスタム関数を活用します。

詳細については、「ユーザー定義関数を使用したクエリ」を参照してください。

2021 年 3 月 30 日

公開日: 2021 年 3 月 30 日

Amazon Athena が、アジアパシフィック (香港) および中東 (バーレーン) リージョンでの Athena エンジンバージョン 2 の提供開始を発表しました。

Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。

2021 年 3 月 25 日

公開日: 2021 年 3 月 25 日

Amazon Athena が、ヨーロッパ (ストックホルム) リージョンでの Athena エンジンバージョン 2 の提供開始を発表しました。

Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。

2021 年 3 月 5 日

公開日: 2021 年 3 月 5 日

Amazon Athena が、カナダ (中部)、欧州 (フランクフルト)、および南米 (サンパウロ) の各リージョンでの Athena エンジンバージョン 2 の提供開始を発表しました。

Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。

2021 年 2 月 25 日

公開日: 2021 年 2 月 25 日

Amazon Athena が、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、欧州 (ロンドン)、および欧州 (パリ) の各リージョンでの Athena エンジンバージョン 2 の一般提供開始を発表しました。

Athena エンジンバージョン 2 の詳細については、「Athena エンジンバージョン 2」を参照してください。

Athena リリースノート (2020 年)

2020 年 12 月 16 日

公開日: 2020 年 12 月 16 日

Amazon Athena が、他のリージョンで Athena エンジンバージョン 2、Athena 横串検索、および AWS PrivateLink を提供することを発表しました。

Athena エンジンバージョン 2 と Athena 横串検索

Amazon Athena が、アジアパシフィック (ムンバイ)、アジアパシフィック (東京)、欧州 (アイルランド)、および米国西部 (北カリフォルニア) の各リージョンでの Athena エンジンバージョン 2 および Athena 横串検索の一般提供開始を発表しました。Athena エンジンバージョン 2 と横串検索は、すでに米国東部 (バージニア北部)、米国東部 (オハイオ)、および米国西部 (オレゴン) の各リージョンで利用可能です。

詳細については、「Athena エンジンバージョン 2」および「Amazon Athena 横串検索の使用」を参照してください。

欧州 (ストックホルム) リージョンで Athena の AWS PrivateLink がサポートされるようになりました。Athena の AWS PrivateLink については、「インターフェイス VPC エンドポイントを使用して Amazon Athena に接続する」を参照してください。

2020 年 11 月 24 日

公開日: 2020 年 11 月 24 日

Athena 用の JDBC ドライバー 2.0.16 と ODBC ドライバー 1.1.6 がリリースされました。これらのリリースでは、Okta Verify 多要素認証 (MFA) をアカウントレベルでサポートします。また、Okta MFA を使用して SMS 認証と Google 認証システムの認証を要素として設定することもできます。

新しいドライバー、リリースノート、およびドキュメントをダウンロードするには、「Athena での JDBC ドライバーの使用」および「ODBC を使用した Amazon Athena への接続」を参照してください。

2020 年 11 月 11 日

公開日: 2020 年 11 月 11 日

Amazon Athena が、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国東部 (オハイオ)、および米国西部 (オレゴン) の各リージョンでの Athena エンジンバージョン 2 および横串検索の一般提供開始を発表しました。

Athena エンジンバージョン 2

Amazon Athena が、新しいクエリエンジンバージョンである Athena エンジンバージョン 2 の米国東部 (バージニア北部)、米国東部 (オハイオ)、および米国西部 (オレゴン) の各リージョンでの一般提供開始を発表しました。

Athena エンジンバージョン 2 には、Parquet 形式のデータに対するスキーマ進化のサポート、追加の地理空間関数、ネストされたスキーマの読み取りによるコスト削減のサポート、および JOIN と AGGATE オペレーションにおけるパフォーマンス強化などのパフォーマンス面での改善と新しい機能が含まれています。

フェデレーティッド SQL クエリ

米国東部 (バージニア北部)、米国東部 (オハイオ)、および米国西部 (オレゴン) の各リージョンで、AmazonAthenaPreviewFunctionality ワークグループを使用することなく Athena のフェデレーティッドクエリを利用できるようになりました。

フェデレーティッド SQL クエリを使用して、リレーショナル、非リレーショナル、オブジェクト、カスタムの各データソース間で SQL クエリを実行します。横串検索を使用すると、ユーザーは単一の SQL クエリを送信することで、オンプレミスで実行されているか、クラウド内でホストされている複数のソースのデータをスキャンできます。

複数のアプリケーションに分散されたデータに対する分析の実行は、以下の理由により、複雑で時間がかかる場合があります。

  • 分析に必要なデータは、通常、リレーショナル、キーバリュー、ドキュメント、インメモリ、検索、グラフ、オブジェクト、時系列、および台帳の各データストアに分散されています。

  • これらのソース間のデータを分析するために、分析では複雑なパイプラインを構築してデータを抽出、変換し、データウェアハウスにロードすることで、データにクエリを実行できるようにします。

  • さまざまなソースのデータにアクセスするには、新しいプログラミング言語とデータアクセスコンストラクトを学習する必要があります。

Athena のフェデレーティッド SQL クエリは、データの保管場所にかかわらず、ユーザーがインプレースでデータをクエリできるようにすることで、このような複雑性を排除します。アナリストは、使い慣れた SQL コンストラクトを使用して複数のデータソース間でデータを JOIN してすばやく分析し、後で使用できるようにその結果を Simple Storage Service (Amazon S3) に保存できます。

データソースコネクタ

横串検索を処理するために、Athena は AWS Lambda で実行される Athena データソースコネクタを使用します。以下の事前構築されたオープンソースコネクタは、Athena によって記述され、テストされたものです。これらを使用して、対応するデータソースに対する SQL クエリを Athena で実行します。

カスタムデータソースコネクタ

Athena Query Federation SDK を使用することによって、デベロッパーは任意のデータソースへのコネクタを構築して、Athena がそのデータソースに対して SQL クエリを実行できるようにすることが可能です。Athena Query Federation コネクタは、AWS が提供するコネクタよりも幅広いフェデレーティッドクエリの利点を提供します。コネクタは AWS Lambda で実行されるため、インフラストラクチャを管理したり、ピーク需要に合わせてスケーリングを計画したりする必要はありません。

次のステップ

2020 年 10 月 22 日

公開日: 2020 年 10 月 22 日

これで AWS Step Functions で Athena を呼び出すことができます。AWS Step Functions は、Amazon States Language を直接使用して特定の AWS のサービス を制御できます。Step Functions を Athena で使用して、クエリの実行の開始と停止、クエリ結果の取得、アドホックまたはスケジュールされたデータクエリの実行、Simple Storage Service (Amazon S3) 内のデータレイクからの結果の取得を行うことができます。

詳細については、AWS Step Functions デベロッパーガイドの「Step Functions で Athena を呼び出す」を参照してください。

2020 年 7 月 29 日

公開日: 2020 年 7 月 29 日

JDBC ドライバーバージョン 2.0.13 がリリースされました。このリリースは、Athena に登録された複数のデータカタログ、認証のための Okta サービス、および VPC エンドポイントへの接続の使用をサポートします。

新しいバージョンのドライバーをダウンロードして使用するには、「Athena での JDBC ドライバーの使用」を参照してください。

2020 年 7 月 9 日

公開日: 2020 年 7 月 9 日

Amazon Athena が、圧縮された Hudi データセットのクエリに対するサポートと、Athena に登録するデータカタログを作成、更新、または削除するための AWS CloudFormation の AWS::Athena::DataCatalog リソースを追加しました。

Apache Hudi データセットのクエリ

Apache Hudi は、増分データ処理を簡素化するオープンソースのデータ管理フレームワークです。Amazon Athena が、Amazon S3 ベースのデータレイク内にある Apache Hudi データセットの読み取り最適化ビューのクエリをサポートするようになりました。

詳細については、「Athena を使用した Apache Hudi データセットのクエリ」を参照してください。

AWS CloudFormation データカタログのリソース

Amazon Athena の横串検索機能を使用してデータソースをクエリするには、まずデータカタログを Athena に登録する必要があります。AWS CloudFormation の AWS::Athena::DataCatalog リソースを使用して、Athena に登録するデータカタログを作成、更新、または削除できるようになりました。

詳細については、AWS CloudFormation ユーザーガイドの「AWS::Athena::DataCatalog」を参照してください。

2020 年 6 月 1 日

公開日: 2020 年 6 月 1 日

Amazon Athena での Apache Hive メタストアのメタカタログとしての使用

Athena での AWS Glue Data Catalog に加えて、Athena を 1 つ以上の Apache Hive メタストアに接続できるようになりました。

自己ホスト型の Hive メタストアに接続するには、Athena Hive メタストアコネクタが必要です。Athena は、これに使用できるリファレンス実装コネクタを提供します。コネクタは、ユーザーのアカウントで AWS Lambda 関数として動作します。

詳細については、「外部 Hive メタストア用の Athena データコネクタの使用」を参照してください。

2020 年 5 月 21 日

公開日: 2020 年 5 月 21 日

Amazon Athena がパーティション射影のサポートを追加しました。パーティション射影を使用して、高度にパーティション分割されたテーブルのクエリ処理を高速化し、パーティション管理を自動化します。詳細については、「Amazon Athena でのパーティション射影」を参照してください。

2020 年 4 月 1 日

公開日: 2020 年 4 月 1 日

米国東部 (バージニア北部) リージョンに加えて、アジアパシフィック (ムンバイ)、欧州 (アイルランド)、および米国西部 (オレゴン) の各リージョンでも Amazon Athena のフェデレーティッドクエリユーザー定義関数 (UDF)機械学習推論、および外部 Hive メタストア機能をプレビューできるようになりました。

2020 年 3 月 11 日

公開日: 2020 年 3 月 11 日

Amazon Athena が、クエリの状態推移に関する Amazon CloudWatch Events をパブリッシュするようになりました。クエリの状態が推移 (実行中から成功またはキャンセルなどの最終状態に推移するなど) すると、Athena がクエリ状態変更イベントを CloudWatch Events にパブリッシュします。イベントには、クエリ状態移行に関する情報が含まれます。詳細については、「CloudWatch Events を使用した Athena クエリのモニタリング」を参照してください。

2020 年 3 月 6 日

公開日: 2020 年 3 月 6 日

AWS CloudFormation の AWS::Athena::WorkGroup リソースを使用して、Amazon Athena ワークグループを作成し、更新できるようになりました。詳細については、AWS CloudFormation ユーザーガイドの「AWS::Athena::WorkGroup」を参照してください。

Athena リリースノート (2019 年)

2019 年 11 月 26 日

公開日: 2019 年 12 月 17 日

Amazon Athena が、リレーショナル、非リレーショナル、オブジェクト、およびカスタムの各データソース間における SQL クエリの実行、SQL クエリにおける機械学習モデルの呼び出し、ユーザー定義関数 (UDF) (プレビュー)、メタデータカタログとしての Apache Hive メタストアの Amazon Athena での使用 (プレビュー)、および 4 つの追加のクエリ関連メトリクスに対するサポートを追加しました。

フェデレーティッド SQL クエリ

フェデレーティッド SQL クエリを使用して、リレーショナル、非リレーショナル、オブジェクト、カスタムの各データソース間で SQL クエリを実行します。

Athena のフェデレーティッドクエリを使用して、リレーショナル、非リレーショナル、オブジェクト、およびカスタムの各データソースに保存されているデータをスキャンできるようになりました。横串検索を使用すると、ユーザーは単一の SQL クエリを送信することで、オンプレミスで実行されているか、クラウド内でホストされている複数のソースのデータをスキャンできます。

複数のアプリケーションに分散されたデータに対する分析の実行は、以下の理由により、複雑で時間がかかる場合があります。

  • 分析に必要なデータは、通常、リレーショナル、キーバリュー、ドキュメント、インメモリ、検索、グラフ、オブジェクト、時系列、および台帳の各データストアに分散されています。

  • これらのソース間のデータを分析するために、分析では複雑なパイプラインを構築してデータを抽出、変換し、データウェアハウスにロードすることで、データにクエリを実行できるようにします。

  • さまざまなソースのデータにアクセスするには、新しいプログラミング言語とデータアクセスコンストラクトを学習する必要があります。

Athena のフェデレーティッド SQL クエリは、データの保管場所にかかわらず、ユーザーがインプレースでデータをクエリできるようにすることで、このような複雑性を排除します。アナリストは、使い慣れた SQL コンストラクトを使用して複数のデータソース間でデータを JOIN してすばやく分析し、後で使用できるようにその結果を Simple Storage Service (Amazon S3) に保存できます。

データソースコネクタ

Athena は、AWS Lambda で実行される Athena データソースコネクタを使用して横串検索を処理します。これらのオープンソースのデータソース コネクタを使用して、Amazon DynamoDBApache HBaseAmazon Document DBAmazon CloudWatchAmazon CloudWatch Metrics、および JDBC 準拠のリレーショナルデータベース (MySQL や Apache 2.0 ライセンスに基づく PostgreSQL など) 間でのフェデレーティッド SQL クエリを Athena で実行します。

カスタムデータソースコネクタ

Athena Query Federation SDK を使用することによって、デベロッパーは任意のデータソースへのコネクタを構築して、Athena がそのデータソースに対して SQL クエリを実行できるようにすることが可能です。Athena Query Federation コネクタは、AWS が提供するコネクタよりも幅広いフェデレーティッドクエリの利点を提供します。コネクタは AWS Lambda で実行されるため、インフラストラクチャを管理したり、ピーク需要に合わせてスケーリングを計画したりする必要はありません。

プレビューの可用性

Athena 横串検索は、米国東部 (バージニア北部) リージョンでプレビューできます。

次のステップ

SQL クエリでの機械学習モデルの呼び出し

推論用の機械学習モデルを Athena クエリから直接呼び出せるようになりました。SQL クエリで機械学習モデルを使用できる場合、異常検知、カスタマーコーホート分析、売上予測などの複雑なタスクが、SQL クエリで機能を呼び出すのと同じくらいシンプルになります。

ML モデル

Amazon SageMaker が提供する多数の組み込み型機械学習アルゴリズムを使用すると、独自のモデルをトレーニングするか、AWS Marketplace でモデルパッケージを見つけてサブスクライブして、これらのモデルを Amazon SageMaker ホスティングサービスにデプロイできます。追加の設定は不要です。これらの ML モデルは、Athena コンソール、Athena APIs、および Athena のプレビュー JDBC ドライバーから SQL クエリで呼び出すことができます。

プレビューの可用性

本日から米国東部 (バージニア北部) リージョンで Athena の ML 機能をプレビューできます。

次のステップ

ユーザー定義関数 (UDF) (プレビュー)

カスタムスカラー関数を記述して、それらを Athena クエリで呼び出せるようになりました。UDF は、Athena Query Federation SDK を使用して Java で記述できます。Athena に送信された SQL クエリで UDF が使用されていると、この UDF は AWS Lambda で呼び出され、実行されます。UDF は、SQL クエリの SELECT 句と FILTER 句の両方で使用できます。複数の UDF を同じクエリで呼び出すことができます。

プレビューの可用性

Athena の UDF 機能は、米国東部 (バージニア北部) リージョンでプレビューモードで使用できます。

次のステップ

Amazon Athena での Apache Hive メタストアのメタカタログとしての使用 (プレビュー)

Athena での AWS Glue Data Catalog に加えて、Athena を 1 つ以上の Apache Hive メタストアに接続できるようになりました。

メタストアコネクタ

自己ホスト型の Hive メタストアに接続するには、Athena Hive メタストアコネクタが必要です。Athena は、これに使用できるリファレンス実装コネクタを提供します。コネクタは、ユーザーのアカウントで AWS Lambda 関数として動作します。詳細については、「外部 Hive メタストアの Athena データコネクターの使用 (プレビュー)」を参照してください。

プレビューの可用性

Hive メタストア機能は、米国東部 (バージニア北部) リージョンでプレビューモードで使用できます。

次のステップ

新しいクエリ関連メトリクス

Athena が、Amazon Athena のパフォーマンスを理解するうえで役立つ、追加のクエリメトリクスをパブリッシュするようになりました。Athena は、クエリ関連のメトリクスを Amazon CloudWatch にパブリッシュします。このリリースでは、Athena が以下の追加のクエリメトリクスをパブリッシュします。

  • Query Planning Time – クエリを計画するためにかかった時間。これには、データソースからテーブルパーティションを取得するためにかかった時間も含まれます。

  • Query Queuing Time – クエリがキュー内でリソースを待機していた時間。

  • Service Processing Time – クエリエンジンが処理を完了してから結果が書き込まれるまでにかかった時間。

  • Total Execution Time – Athena がクエリを実行するために費やした時間。

これらの新しいクエリメトリクスを使用するには、カスタムダッシュボードを作成する、CloudWatch のメトリクスにアラームとトリガーを設定する、または Athena コンソールから事前入力済みのダッシュボードを直接使用することができます。

次のステップ

詳細については、「CloudWatch メトリクスを使用した Athena クエリのモニタリング」を参照してください。

2019 年 11 月 12 日

公開日: 2019 年 12 月 17 日

Amazon Athena が、中東 (バーレーン) リージョンで利用可能になりました。

2019 年 11 月 8 日

公開日: 2019 年 12 月 17 日

Amazon Athena が米国西部 (北カリフォルニア) リージョンと欧州 (パリ) リージョンで利用可能になりました。

2019 年 10 月 8 日

公開日: 2019 年 12 月 17 日

Amazon Athena が、Virtual Private Cloud (VPC) のインターフェイス VPC エンドポイント経由での Athena への直接接続を許可するようになりました。この機能を使用することで、VPC にインターネットゲートウェイを設定する必要なく、安全にクエリを Athena に送信できます。

Athena に接続するためのインターフェイス VPC エンドポイントを作成するには、AWS Management Console または AWS Command Line Interface (AWS CLI) を使用します。インターフェイスエンドポイントの作成については、「インターフェイスエンドポイントの作成」を参照してください。

インターフェイス VPC エンドポイントを使用すると、VPC と Athena API 間の通信がセキュア化され、AWS ネットワーク内にとどまります。この機能を使用するために、追加の Athena 料金は発生しません。インターフェイス VPC エンドポイントの料金が適用されます。

この機能の詳細については、「インターフェイス VPC エンドポイントを使用して Amazon Athena Connect する」を参照してください。

2019 年 9 月 19 日

公開日: 2019 年 12 月 17 日

Amazon Athena では、INSERT INTO ステートメントを使用して既存のテーブルに新しいデータを挿入できるようになりました。ソーステーブルで実行される SELECT クエリステートメント、またはクエリステートメントの一部として提供される値のセットに基づいて、ターゲットテーブルに新しい行を挿入できます。データ形式として Avro、JSON、ORC、Parquet、テキストファイルなどがサポートされています。

INSERT INTO ステートメントを使用して ETL プロセスを簡素化することもできます。たとえば、単一のクエリで INSERT INTO を使用することで、JSON 形式のソーステーブルからデータを選択して Parquet 形式のターゲットテーブルに書き込むことができます。

INSERT INTO ステートメントは、Athena での SELECT クエリの場合と同様に、SELECT フェーズでスキャンしたバイト数に基づいて課金されます。詳細については、「Amazon Athena の料金」を参照してください。

サポートされている形式、SerDes、および例などの INSERT INTO の使用に関する詳細については、Athena ユーザーガイドの「INSERT INTO」を参照してください。

2019 年 9 月 12 日

公開日: 2019 年 12 月 17 日

Amazon Athena が、アジアパシフィック (香港) リージョンで利用可能になりました。

2019 年 8 月 16 日

公開日: 2019 年 12 月 17 日

Amazon Athena が、Amazon S3 リクエスタ支払いバケット内のデータに対するクエリのサポートを追加しました。

Amazon S3 バケットがリクエスタ支払いとして設定されている場合、Amazon S3 リクエストとデータ転送のコストは、バケット所有者ではなくリクエスタが支払います。Athena では、ワークグループ管理者が、ワークグループメンバーによる S3 リクエスタ支払いバケットへのクエリを許可するようにワークグループを設定できるようになりました。

ワークグループのリクエスタ支払い設定を行う方法については、Amazon Athena ユーザーガイドの「ワークグループの作成」を参照してください。リクエスタ支払いバケットの詳細については、「Amazon Simple Storage Service デベロッパーガイド」の「リクエスタ支払いバケット」を参照してください。

2013 年 8 月 9 日

公開日: 2019 年 12 月 17 日

Amazon Athena が、Simple Storage Service (Amazon S3) に保存されたデータ用の AWS Lake Formation で定義された、新しい、または既存のデータベース、テーブル、および列に対するきめ細かなアクセスコントロールのための AWS Glue Data Catalog ポリシーの実施をサポートするようになりました。

この機能は、米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (オレゴン)、アジアパシフィック (東京)、および欧州 (アイルランド) の各 AWS リージョン で利用できます。この機能の使用に追加料金は発生しません。

この機能の使用方法については、「Athena を使用して AWS Lake Formation に登録されたデータをクエリする」を参照してください。の詳細については、「AWS Lake Formation」を参照してください。AWS Lake Formation

2019 年 6 月 26 日

Amazon Athena が欧州 (ストックホルム) リージョンで利用可能になりました。サポートされているリージョンのリストについては、AWS リージョン およびエンドポイントを参照してください。

2019 年 5 月 24 日

公開日: 2019 年 05 月 24 日

Amazon Athena が AWS GovCloud (米国東部) および AWS GovCloud (米国西部) の各リージョンで利用可能になりました。サポートされているリージョンのリストについては、AWS リージョン およびエンドポイントを参照してください。

2019 年 3 月 5 日

公開日: 2019 年 03 月 05 日

Amazon Athena がカナダ (中部) リージョンで利用可能になりました。サポートされているリージョンのリストについては、AWS リージョン およびエンドポイントを参照してください。Athena ワークグループをサポートする新しいバージョンの ODBC ドライバーがリリースされました。詳細については、ODBC ドライバーリリースノートを参照してください。

ODBC ドライバーのバージョン 1.0.5 とそのドキュメントをダウンロードするには、「ODBC を使用した Amazon Athena への接続」を参照してください。このバージョンの詳細については、「ODBC ドライバーリリースノート」を参照してください。

ODBC ドライバーでワークグループを使用するには、次の例に示すように、接続文字列に新しい接続プロパティ Workgroup を設定します。

Driver=Simba Athena ODBC Driver;AwsRegion=[Region];S3OutputLocation=[S3Path];AuthenticationType=IAM Credentials;UID=[YourAccessKey];PWD=[YourSecretKey];Workgroup=[WorkgroupName]

詳細については、「ODBC ドライバーのインストールおよび設定ガイドバージョン 1.0.5」で「workgroup」を検索してください。ワークグループでタグを使用しても、ODBC ドライバーの接続文字列は変更されません。タグを使用するには、最新バージョンの ODBC ドライバー (この最新バージョン) にアップグレードしてください。

このドライバーバージョンでは、Athena API ワークグループアクションを使用してワークグループを作成および管理し、Athena API タグアクションを使用してワークグループのタグを追加、リスト化、または削除することができます。使用を開始する前に、ワークグループとタグに対するアクションに関するリソースレベルの IAM 許可があることを確認してください。

詳細については、以下を参照してください。

JDBC ドライバー、または AWS SDK を使用している場合は、最新バージョンのドライバーと SDK にアップグレードしてください。どちらにも、Athena のワークグループとタグのサポートが既に含まれています。詳細については、「Athena での JDBC ドライバーの使用」を参照してください。

2019 年 2 月 22 日

公開日: 2019 年 02 月 22 日

Amazon Athena のワークグループにタグのサポートを追加しました。タグは、1 つのキーと 1 つの値で構成されており、どちらもお客様側が定義します。ワークグループにタグを付けるときは、カスタムメタデータを割り当てます。AWS タグ付けのベストプラクティスを使用して、ワークグループにタグを追加してそれらを分類することができます。タグを使用してワークグループへのアクセスを制限し、コストを追跡することができます。たとえば、コストセンターごとにワークグループを作成します。その後、これらのワークグループにタグを追加することで、各コストセンターの Athena 支出を追跡できます。詳細については、AWS Billing and Cost Management ユーザーガイドの「請求へのタグの使用」を参照してください。

タグは、Athena コンソール、または API オペレーションを使用することで操作できます。詳細については、「Athena リソースへのタグ付け」を参照してください。

Athena コンソールでは、各ワークグループに 1 つ、または複数のタグを追加して、それらをタグで検索することができます。ワークグループは、Athena にある IAM で管理されるリソースです。IAM では、作成したワークグループのタグを追加、削除、またはリスト化できるユーザーを制限できます。ワークグループに 1 つ以上のタグを追加するためのオプションのタグパラメータを持つ CreateWorkGroup API オペレーションを使用することもできます。タグを追加、削除、または一覧表示するには、TagResourceUntagResource、および ListTagsForResource を使用します。詳細については、「タグオペレーションの使用」を参照してください。

ワークグループの作成時にユーザーがタグを追加できるようにするには、各ユーザーに TagResourceCreateWorkGroup の API アクションの両方に対する IAM 許可を付与するようにしてください。詳細な説明と例については、タグベースの IAM アクセスコントロールポリシーを参照してください。

ワークグループでタグを使用しても、JDBC ドライバーは変更されません。新しいワークグループを作成して JDBC ドライバーまたは AWS SDK を使用する場合は、最新バージョンのドライバーと SDK に更新してください。詳細については、Athena での JDBC ドライバーの使用 を参照してください。

2019 年 2 月 18 日

公開日: 2019 年 02 月 18 日

ワークグループでクエリを実行することによってクエリコストを制御する機能が追加されました。詳細については、ワークグループを使用してクエリのアクセスとコストを制御する を参照してください。Athena で使用される JSON OpenX SerDe を改善し、Athena が GLACIER ストレージクラスに移行されたオブジェクトを無視しないという問題を修正しました。また、Network Load Balancer ログをクエリする例を追加しました。

以下の変更を加えました。

  • ワークグループ用のサポートを追加しました。ワークグループを使用して、ユーザー、チーム、アプリケーション、またはワークロードを分離し、各クエリまたはワークグループ全体で処理できるデータ量に制限を設定します。ワークグループは IAM リソースとして機能するため、リソースレベルのアクセス許可を使用して特定のワークグループへのアクセスを制御できます。Amazon CloudWatch でクエリ関連のメトリクスを表示する、スキャンされるデータの量に制限を設定することによってクエリコストを管理する、しきい値を作成する、およびこれらのしきい値を超えたときに Amazon SNS アラームなどのアクションをトリガーすることもできます。詳細については、「クエリを実行するためのワークグループの使用」および「CloudWatch のメトリクスとイベントを使用したコストの管理とクエリのモニタリング」を参照してください。

    ワークグループは、IAM リソースです。IAM のワークグループ関連のアクション、リソース、および条件の完全なリストについては、サービス認証リファレンスの「Amazon Athena のアクション、リソース、および条件キー」を参照してください。新しいワークグループを作成する前に、ワークグループの IAM ポリシーAWS 管理ポリシー: AmazonAthenaFullAccess を使用するようにしてください。

    コンソール、ワークグループ API オペレーション、または JDBC ドライバーを使用して、ワークグループの使用を開始できます。大まかな手順については、「ワークグループのセットアップ」を参照してください。ワークグループサポート付きの JDBC ドライバーをダウンロードするには、「Athena での JDBC ドライバーの使用」を参照してください。

    JDBC ドライバーでワークグループを使用する場合は、次の例のように Workgroup 設定パラメータを使用して接続文字列にワークグループ名を設定する必要があります。

    jdbc:awsathena://AwsRegion=<AWSREGION>;UID=<ACCESSKEY>; PWD=<SECRETKEY>;S3OutputLocation=s3://<athena-output>-<AWSREGION>/; Workgroup=<WORKGROUPNAME>;

    SQL ステートメントの実行方法やドライバーへの JDBC API 呼び出しの方法に変更はありません。ドライバーがワークグループ名を Athena に渡します。

    ワークグループに導入された変更点については、「 Athena ワークグループ API」および「ワークグループのトラブルシューティング」を参照してください。

  • Athena で使用される JSON OpenX SerDe を改善しました。改善点は次のとおりです。

    • ConvertDotsInJsonKeysToUnderscores プロパティをサポートします。TRUE に設定すると、SerDe はキー名のドットをアンダースコアに置き換えることができます。例えば、JSON データセットに "a.b" という名前のキーが含まれている場合は、このプロパティを使用して、Athena で列名が "a_b" になるように定義できます。デフォルト: FALSE。デフォルトで、Athena は列名にドットを許可しません。

    • case.insensitive プロパティをサポートします。デフォルトで、Athena では JSON データセットのすべてのキーに小文字が使用される必要があります。WITH SERDE PROPERTIES ("case.insensitive"= FALSE;) を使用すると、データ内で大文字と小文字を区別してキー名を使用できます。デフォルト: TRUETRUE に設定すると、SerDe はすべての大文字の列を小文字に変換します。

    詳細については、「OpenX JSON SerDe」を参照してください。

  • Simple Storage Service (Amazon S3) ライフサイクルポリシーによって Glacier にアーカイブされた Amazon S3 オブジェクトを処理したときに、Athena が "access denied" エラーメッセージを返す問題を修正しました。この問題を解決した結果、Athena が GLACIER ストレージクラスに移行したオブジェクトを無視するようになりました。Athena では、GLACIER ストレージクラスからのデータのクエリがサポートされていません。

    詳細については、「Athena のテーブルと Amazon S3 のデータに関する要件」および 「Amazon Simple Storage Service ユーザーガイド」の「Transitioning to the GLACIER Storage Class (Object Archival)」(GLACIER ストレージクラスへの移行 (オブジェクトのアーカイブ)) を参照してください。

  • Transport Layer Security (TLS) リクエストに関する情報を受け取る Network Load Balancer アクセスログのクエリ例を追加しました。詳細については、「Network Load Balancer のログのクエリ」を参照してください。

Athena リリースノート (2018 年)

2018 年 11 月 20 日

公開日: 2018 年 11 月 20 日

AD FS および SAML 2.0 (Security Assertion Markup Language 2.0) を使用した Athena API へのフェデレーションアクセスをサポートする新しいバージョンの JDBC および ODBC ドライバーをリリースしました。詳細については、JDBC ドライバーリリースノートおよび ODBC ドライバーリリースノートを参照してください。

このリリースによって、Athena へのフェデレーションアクセスが Active Directory Federation Service (AD FS 3.0) 対応になります。アクセスは、SAML 2.0 をサポートするバージョンの JDBC や ODBC ドライバーを通じて確立されます。Athena API へのフェデレーションアクセスの設定に関する詳細については、「Athena API へのフェデレーションアクセスの有効化」を参照してください。

JDBC ドライバーのバージョン 2.0.6 とそのドキュメントをダウンロードするには、「Athena での JDBC ドライバーの使用」を参照してください。このバージョンの詳細については、「JDBC ドライバーリリースノート」を参照してください。

ODBC ドライバーのバージョン 1.0.4 とそのドキュメントをダウンロードするには、「ODBC を使用した Amazon Athena への接続」を参照してください。このバージョンの詳細については、「ODBC ドライバーリリースノート」を参照してください。

AWS での SAML 2.0 のサポートに関する詳細については、IAM ユーザーガイドの「SAML 2.0 ベースのフェデレーションについて」を参照してください。

2018 年 10 月 15 日

公開日: 2018 年 10 月 15 日

AWS Glue Data Catalog にアップグレードしている場合は、以下のサポートを提供する 2 つの新機能があります。

  • データカタログメタデータの暗号化。データカタログでメタデータを暗号化することを選択する場合は、Athena に特定のポリシーを追加する必要があります。詳細については、「AWS Glue Data Catalog の暗号化されたメタデータへのアクセス」を参照してください。

  • AWS Glue Data Catalog のリソースへのアクセスに対するきめ細かなアクセス許可。Athena で使用されるデータカタログからの特定のデータベースとテーブルへのアクセスを制限または許可する、アイデンティティベースの (IAM) ポリシーを定義できるようになりました。詳細については、「AWS Glue Data Catalog のデータベースとテーブルへのきめ細かなアクセス」を参照してください。

    注記

    データは Amazon S3 バケットに格納されており、それらに対するアクセスは Amazon S3 へのアクセス権によって制御されます。データベースとテーブル内のデータにアクセスするには、データを保存する Amazon S3 バケットへのアクセスコントロールポリシーを引き続き使用します。

2018 年 10 月 10 日

公開日: 2018 年 10 月 10 日

Athena では、SELECT クエリステートメントの結果からテーブルを作成する CREATE TABLE AS SELECT がサポートされています。詳細については、「クエリ結果からのテーブルの作成 (CTAS)」を参照してください。

CTAS クエリを作成する前に、Athena ドキュメントでそれらの動作について学習しておくことが重要です。ドキュメントには、クエリ結果を保存するための Amazon S3 の場所、CTAS クエリ結果を保存するためにサポートされている形式のリスト、作成できるパーティションの数、およびサポートされている圧縮形式に関する情報が記載されています。詳細については、「CTAS クエリに関する考慮事項と制約事項」を参照してください。

以下の目的で CTAS クエリを使用します。

2018 年 9 月 6 日

公開日: 2018 年 09 月 06 日

ODBC ドライバーの新しいバージョン (バージョン 1.0.3) がリリースされました。新しいバージョンの ODBC ドライバーは、ページングではなく、デフォルトで結果をストリーミングします。これによりビジネスインテリジェンスツールで大規模なデータセットを迅速に取得できます。このバージョンには改善点、バグ修正、および更新された「プロキシサーバーで SSL を使用する」ドキュメントが含まれています。詳細については、ドライバーのリリースノートを参照してください。

ODBC ドライバーのバージョン 1.0.3 とそのドキュメントのダウンロードについては、「ODBC を使用した Amazon Athena への接続」を参照してください。

結果のストリーミング機能は、新しいバージョンの ODBC ドライバーでのみ使用できます。JDBC ドライバーでも使用できます。結果のストリーミングの詳細については、ODBC ドライバーのインストールおよび設定ガイドで「UseResultsetStreaming」を検索してください。

ODBC ドライバーのバージョン 1.0.3 は、以前のバージョンのドライバーのドロップインリプレースです。最新のドライバーに移行することをお勧めします。

重要

ODBC ドライバーバージョン 1.0.3 を使用するには、次の要件に従ってください。

  • アウトバウンドトラフィックに対してポート 444 を開いたままにする。

  • ​Athena のポリシーのリストに ​athena:GetQueryResultsStream ポリシーアクションを追加する。このポリシーアクションは、API で直接公開されていません。結果のストリーミングサポートの一部として ODBC ドライバーおよび JDBC ドライバーとともに使用するだけです。ポリシーの例については、「AWS 管理ポリシー: AWSQuicksightAthenaAccess」を参照してください。

2018 年 8 月 23 日

公開日: 2018 年 08 月 23 日

次に示すとおり DDL に関連する機能のサポートが追加され、バグがいくつか修正されました。

  • Parquet のデータの BINARYDATE データ型、Avro のデータの DATETIMESTAMP データ型のサポートが追加されました。

  • DDL クエリの INTDOUBLE のサポートが追加されました。INTEGERINT のエイリアス、DOUBLE PRECISIONDOUBLE のエイリアスです。

  • DROP TABLEDROP DATABASE のクエリのパフォーマンスが改善されました。

  • データバケットが空になっているときに Simple Storage Service (Amazon S3) で _$folder$ オブジェクトが作成されなくなりました。

  • パーティション値が指定されなかった場合、ALTER TABLE ADD PARTITION がエラーをスローする問題を修正しました。

  • ステートメントに修飾名が指定された後に、パーティションをチェックするときに、DROP TABLE がデータベース名を無視する問題を修正しました。

Athena でサポートされているデータ型の詳細については、「Amazon Athena のデータ型」を参照してください。

Athena、JDBC ドライバー、および Java のデータ型間でサポートされているデータ型マッピングについては、ODBC Driver Installation and Configuration Guide の「Data Types」セクションを参照してください。

2018 年 8 月 16 日

公開日: 2018 年 08 月 16 日

JDBC ドライバーのバージョン 2.0.5 がリリースされました。新しいバージョンの JDBC ドライバーは、ページングではなく、デフォルトで結果をストリーミングします。これによりビジネスインテリジェンスツールで大規模なデータセットを迅速に取得できます。JDBC ドライバーの以前のバージョンと比較して、次のパフォーマンスが向上しています。

  • 10,000 行未満を取得するときに、パフォーマンスが約 2 倍向上します。

  • 10,000 行以上を取得するときに、パフォーマンスが 5 ~ 6 倍向上します。

結果のストリーミング機能は、JDBC ドライバーでのみ使用できます。ODBC ドライバーでは使用できません。これを Athena API で使用することはできません。結果のストリーミングの詳細については、JDBC ドライバーのインストールおよび設定ガイドで「UseResultsetStreaming」を検索してください。

JDBC ドライバーのバージョン 2.0.5 とそのドキュメントのダウンロードについては、「Athena での JDBC ドライバーの使用」を参照してください。

JDBC ドライバーのバージョン 2.0.5 は、以前のバージョンのドライバー (2.0.2) のドロップインリプレースです。JDBC ドライバーバージョン 2.0.5 が必ず使用されるようにするには、Athena のポリシーのリストに athena:GetQueryResultsStream ポリシーアクションを追加します。このポリシーアクションは、API で直接公開されていません。結果のストリーミングサポートの一部として JDBC ドライバーとともに使用するだけです。ポリシーの例については、「AWS 管理ポリシー: AWSQuicksightAthenaAccess」を参照してください。ドライバーのバージョン 2.0.2 からバージョン 2.0.5 への移行の詳細については、JDBC ドライバー移行ガイドを参照してください。

ドライバーをバージョン 1.x から 2.x に移行する場合は、既存の設定を新しい設定に移行する必要があります。最新バージョンのドライバーに移行することを強くお勧めします。詳細については、JDBC Driver Migration Guide」(JDBC ドライバー移行ガイド) を参照してください。

2018 年 8 月 7 日

公開日: 2018 年 08 月 07 日

Amazon Virtual Private Cloud フローログを Amazon S3 に GZIP 形式で直接保存できるようになりました。これらは、Athena でクエリすることができます。詳細については、「Amazon VPC フローログのクエリ」および「Amazon VPC フローログが S3 で使用可能に」を参照してください。

2018 年 5 月 6 日

公開日: 2018 年 06 月 05 日

ビューのサポート

ビューのサポートが追加されました。Athena で CREATE VIEWDESCRIBE VIEWDROP VIEWSHOW CREATE VIEW、および SHOW VIEWS が使用できるようになりました。ビューを定義するクエリは、クエリでビューを参照するたびに実行されます。詳細については、「ビューの使用」を参照してください。

エラーメッセージの改善と更新

  • GSON 2.8.0 ライブラリを CloudTrail SerDe に含めることで、CloudTrail SerDe の問題を解決し、JSON 文字列の改正を有効にしました。

  • 列の順序変更を可能にすることによって、Parquet (場合によっては ORC) に対する Athena でのパーティションスキーマ検証が強化されました。これにより、Athena では徐々に進化するスキーマの変化と AWS Glue クローラから追加されるテーブルに適切に対応できるようになりました。詳細については、「スキーマ更新の処理」を参照してください。

  • SHOW VIEWS に解析サポートが追加されました。

  • 最も一般的なエラーメッセージに次の改善が加えられました。

    • Athena クエリで SerDe が列の解析に失敗するときの「Internal Error」メッセージを、説明的なエラーメッセージに置き換えました。これまで、Athena は解析エラーの場合に内部エラーを発行していました。新しいエラーメッセージは次のようになります。「HIVE_BAD_DATA: フィールド 0: java.lang のフィールド値の解析エラー。文字列は org.openx.data.jsonserde.json.JSONObject にキャストできません」

    • アクセス許可不足のエラーメッセージが改善されて、詳細が追加されました。

バグ修正

以下のバグを修正しました。

  • REAL から FLOAT データ型への内部変換を有効にする問題が修正されました。これにより、FLOAT データ型を返す AWS Glue クローラの統合が改善されました。

  • Athena が AVRO DECIMAL (論理的な型) を DECIMAL 型に変換しない問題が修正されました。

  • WHERE 句が TIMESTAMP データ型の値を参照している場合に、Parquet データをクエリすると、Athena で 結果が返されないという問題を修正しました。

2018 年 5 月 17 日

公開日: 2018 年 05 月 17 日

Athena でのクエリ同時実行のクォータが 5 件から 20 件に増加されました。これによって、20 件までの DDL クエリおよび 20 件までの SELECT クエリを同時に送信して実行できます。同時実行数のクォータは、DDL および SELECT クエリで別であることに注意してください。

Athena での同時実行クォータは、サービスに対して同時に送信できるクエリの数として定義されます。同じタイプ (DDL あるいは SELECT) のクエリを同時に 20 件まで送信できます。同時実行クエリのクォータを超えるクエリを送信すると、Athena API がエラーメッセージを表示します。

Athena にクエリを送信すると、Athena は、全体的なサービス負荷と着信リクエストの量に基づいてリソースを割り当てることによってクエリを処理します。当社では継続的にサービスをモニタリングして調整を行うため、お客様のクエリはできるだけ短期間で処理されます。

詳細については、Service Quotas を参照してください。これは調整可能なクォータです。Service Quotas コンソールを使用して、同時実行クエリのクォータの引き上げをリクエストできます。

2018 年 4 月 19 日

公開日: 2018 年 04 月 19 日

配列データ型として ResultSet を返すサポート、改良点、およびバグ修正を反映した、新しいバージョンの JDBC ドライバー (バージョン 2.0.2) をリリースしました。詳細については、ドライバーのリリースノートを参照してください。

JDBC ドライバーの新しいバージョン 2.0.2 とそのドキュメントのダウンロードについては、「Athena での JDBC ドライバーの使用」を参照してください。

JDBC ドライバーの最新バージョンは 2.0.2 です。ドライバーをバージョン 1.x から 2.x に移行する場合は、既存の設定を新しい設定に移行する必要があります。最新のドライバーに移行することを強くお勧めします。

新しいバージョンのドライバーの変更点、バージョンの相違点、例については、「JDBC ドライバー移行ガイド」を参照してください。

2018 年 4 月 6 日

公開日: 2018 年 04 月 06 日

Athena コンソールでのクエリの入力に自動入力を使用します。

2018 年 3 月 15 日

公開日: 2018 年 03 月 15 日

CloudTrail コンソールから直接 CloudTrail ログファイル用の Athena テーブルを自動作成する機能を追加しました。詳細については、CloudTrail ログ用の Athena テーブルを作成するための CloudTrail コンソールの使用 を参照してください。

2018 年 2 月 2 日

公開日: 2018 年 02 月 12 日

GROUP BY 句を使用するメモリに大きな負担をかけるクエリのディスクに中間データを安全にオフロードする機能が追加されました。これでこのようなクエリの信頼性が向上し、「Query resource exhausted」(クエリリソースの枯渇) エラーを回避します。

2018 年 1 月 19 日

公開日: 2018 年 01 月 19 日

Athena は、オープンソースの分散型クエリエンジンである Presto を使用してクエリを実行します。

Athena には管理するバージョンがありません。Athena の基盤となるエンジンを Presto 0.172 に基づくバージョンに透過的にアップグレードしました。ユーザー操作は必要はありません。

このアップグレードにより、Athena で Presto 0.172 Lambda Expressions を含めた Presto 0.172 Functions and Operators を使用できるようになります。

このリリースの主な更新 (コミュニティ提供の修正を含む) は以下のとおりです。

  • ヘッダーを無視するサポート。Athena がヘッダーを無視できるように、テーブルの定義時に skip.header.line.count プロパティを使用することができます。これは、Grok または Regex SerDes ではなく、LazySimpleSerDeOpenCSV SerDe を使用するクエリをサポートします。

  • STRING 関数での CHAR(n) データ型のサポート。CHAR(n) の範囲は [1.255] です。VARCHAR(n) の範囲は [1,65535] です。

  • 相関サブクエリのサポート。

  • Presto Lambda 式および関数のサポート。

  • DECIMAL 型と演算子のパフォーマンスが向上しました。

  • フィルタ処理された集計のサポート (SELECT sum(col_name) FILTER である id > 0 など)。

  • DECIMALTINYINTSMALLINT、および REAL の各データ型のプッシュダウン述語。

  • 限定比較述語のサポート (ALLANY、および SOME)。

  • 追加された関数: arrays_overlap()array_except()levenshtein_distance()codepoint()skewness()kurtosis()、および typeof()

  • タイムゾーン引数を使用する from_unixtime() 関数のバリアントを追加しました。

  • bitwise_and_agg() 集計関数と bitwise_or_agg() 集計関数を追加しました。

  • xxhash64() 関数と to_big_endian_64() 関数を追加しました。

  • JSON パスの添字でバックスラッシュを使用して二重引用符やバックスラッシュをエスケープするためのサポートを json_extract() 関数と json_extract_scalar() 関数に追加しました。これまでバックスラッシュは標準の文字として扱われていたために、これによってバックスラッシュを使用した呼び出しのセマンティクスが変わります。

関数と演算子の完全なリストについては、本ガイドの「DML クエリ、関数、および演算子」、および「Presto ドキュメント」の「Functions and operators」(関数と演算子) を参照してください。

Athena はすべての Presto 機能をサポートしません。詳細については、「制限」を参照してください。

Athena リリースノート (2017 年)

2017 年 11 月 13 日

公開日: 2017 年 11 月 13 日

Athena を ODBC ドライバーに接続するためのサポートを追加しました。詳細については、ODBC を使用した Amazon Athena への接続 を参照してください。

2017 年 11 月 1 日

公開日: 2017 年 11 月 01 日

地理空間データのクエリのサポートをアジアパシフィック (ソウル)、アジアパシフィック (ムンバイ)、および欧州 (ロンドン) の各リージョンに追加しました。詳細については、「地理空間データのクエリ」と「AWS リージョン とエンドポイント」を参照してください。

2017 年 10 月 19 日

公開日: 2017 年 10 月 19 日

欧州 (フランクフルト) のサポートを追加しました。サポートされているリージョンの一覧は、「AWS リージョン とエンドポイント」を参照してください。

2017 年 10 月 3 日

公開日: 2017 年 10 月 03 日

AWS CloudFormation で名前付き Athena クエリを作成します。詳細については、https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/aws-resource-athena-namedquery.html ユーザーガイドの「AWS CloudFormationAWS::Athena::NamedQuery」を参照してください。

2017 年 9 月 25 日

公開日: 2017 年 09 月 25 日

アジアパシフィック (シドニー) リージョンのサポートを追加しました。サポートされているリージョンの一覧は、「AWS リージョン とエンドポイント」を参照してください。

2017 年 8 月 14 日

公開日: 2017 年 08 月 14 日

AWS Glue Data Catalog との統合を追加したほか、Athena で管理されるデータカタログから AWS Glue Data Catalog に更新するための移行ウィザードを追加しました。詳細については、「AWS Glue との統合」を参照してください。

2017 年 8 月 4 日

公開日: 2017 年 08 月 04 日

Grok SerDe のサポートを追加しました。これにより、ログなどの構造化されていないテキストファイルのレコードのパターンマッチングが容易になります。詳細については、「Grok SerDe」を参照してください。コンソールを使用してクエリ履歴をスクロールするためのキーボードショートカットを追加しました (Windows での CTRL +⇧/⇩、Mac での CMD + ⇧/⇩)。

2017 年 6 月 22 日

公開日: 2017 年 06 月 22 日

アジアパシフィック (東京) およびアジアパシフィック (シンガポール) の各リージョンのサポートを追加しました。サポートされているリージョンの一覧は、「AWS リージョン とエンドポイント」を参照してください。

2017 年 6 月 8 日

公開日: 2017 年 06 月 08 日

欧州 (アイルランド) のサポートを追加しました。詳細については、AWS リージョン およびエンドポイントを参照してください。

2017 年 5 月 19 日

公開日: 2017 年 05 月 19 日

Amazon Athena API および Athena 用の AWS CLI サポートを追加し、JDBC ドライバーをバージョン 1.1.0 に更新しました。また、さまざまな問題を修正しました。

  • Amazon Athena により、Athena のアプリケーションプログラミングが可能になります。詳細については、Amazon Athena API リファレンスを参照してください。最新の AWS SDK には、Athena API のサポートが含まれています。ドキュメントとダウンロードのリンクについては、「Amazon Web Services のツール」の「SDK」セクションを参照してください。

  • AWS CLI には、Athena 用の新しいコマンドが含まれています。詳細については、Amazon Athena API リファレンスを参照してください。

  • 新しい JDBC ドライバー 1.1.0 が利用可能になりました。最新バージョンでは、新しい Athena API のサポート、最新の特徴、バグ修正が追加されています。ドライバーを https://s3.amazonaws.com/athena-downloads/drivers/AthenaJDBC41-1.1.0.jar からダウンロードしてください。最新の Athena JDBC ドライバーにアップグレードすることをお勧めします。ただし、以前のドライバーバージョンもまだ使用できます。以前のドライバーバージョンでは Athena API をサポートしていません。詳細については、「Athena での JDBC ドライバーの使用」を参照してください。

  • 以前のバージョンの Athena でポリシーステートメント固有であったアクションは廃止されました。JDBC ドライバーバージョン 1.1.0 にアップグレードして、カスタマー管理の IAM ポリシーやインライン IAM ポリシーを JDBC ユーザーにアタッチする場合は、IAM ポリシーを更新する必要があります。一方、以前のバージョンの JDBC ドライバーは Athena API をサポートしていないため、廃止されたアクションは以前のバージョンの JDBC ユーザーにアタッチされているポリシーでのみ指定できます。このため、カスタマー管理の IAM ポリシーやインライン IAM ポリシーを更新する必要はありません。

  • これらのポリシー固有のアクションは、Athena API のリリース前に Athena で使用されていたものです。これらの廃止されたアクションは、バージョン 1.1.0 より前の JDBC ドライバーのポリシーでのみ使用します。JDBC ドライバーをアップグレードする場合は、廃止されたアクションを許可または拒否するポリシーステートメントを、以下に示す適切な API アクションに置き換えてください。置き換えないと、エラーが発生します。

廃止されたポリシー固有のアクション 対応する Athena API アクション
athena:RunQuery
athena:StartQueryExecution
athena:CancelQueryExecution
athena:StopQueryExecution
athena:GetQueryExecutions
athena:ListQueryExecutions

改良点

  • クエリ文字列の長さの上限を 256 KB に増やしました。

バグ修正

  • コンソールでクエリ結果をスクロールしたときに正常に表示されない問題を修正しました。

  • Amazon S3 データファイルの \u0000 文字列のせいでエラーが発生するという問題を修正しました。

  • JDBC ドライバーを通じて行ったクエリキャンセルのリクエストが失敗するという問題を修正しました。

  • 米国東部 (オハイオ) の Simple Storage Service (Amazon S3) データで AWS CloudTrail SerDe が失敗するという問題を修正しました。

  • パーティション分割されたテーブルで DROP TABLE が失敗するという問題を修正しました。

2017 年 4 月 4 日

公開日: 2017 年 04 月 04 日

Amazon S3 のデータ暗号化のサポートを追加しました。また、暗号化のサポート、改良点、およびバグ修正を反映した JDBC ドライバーのアップデート (バージョン 1.0.1) をリリースしました。

機能

  • 以下の暗号化機能を追加しました。

    • Amazon S3 の暗号化されたデータのクエリのサポート。

    • Athena クエリ結果の暗号化のサポート。

  • 新しいバージョンのドライバーは新しい暗号化機能をサポートし、改良点とバグ修正を追加しました。

  • ALTER TABLE を使用して列を追加、置換、変更する機能を追加しました。詳細については、Hive ドキュメントの「Alter 列」を参照してください。

  • LZO 圧縮データのクエリのサポートを追加しました。

詳細については、「保管中の暗号化」を参照してください。

改良点

  • JDBC のクエリパフォーマンスが向上しました。ページサイズの改善により、100 行ではなく 1,000 行が返されます。

  • JDBC ドライバーインターフェイスを使用してクエリをキャンセルする機能を追加しました。

  • JDBC 接続 URL で JDBC オプションを指定する機能を追加しました。最新の JDBC ドライバーについては、「Athena での JDBC ドライバーの使用」を参照してください。

  • ドライバーでの PROXY 設定を追加しました。この設定は、AWS SDK for Java の ClientConfiguration を使用して行うことができます。

バグ修正

以下のバグを修正しました。

  • JDBC ドライバーを使用して複数のクエリを実行すると、スロットリングエラーが発生する場合がある。

  • decimal データ型の射影時に JDBC ドライバーが停止する。

  • テーブルでのデータ型の定義に関係なく、JDBC ドライバーはすべてのデータ型を文字列として返す。たとえば、INT データ型として定義されている列を resultSet.GetObject() を使用して選択すると、INT データ型が返されずに STRING データ型が返される。

  • JDBC ドライバーでの認証情報の検証が、クエリの実行時に行われずに接続時に行われる。

  • スキーマを URL と共に指定すると、JDBC ドライバーを介したクエリが失敗する。

2017 年 3 月 24 日

公開日: 2017 年 03 月 24 日

AWS CloudTrail SerDe の追加、パフォーマンスの向上、およびパーティション問題の修正を行いました。

機能

改良点

  • 多数のパーティションをスキャンするときのパフォーマンスを改善しました。

  • MSCK Repair Table オペレーションのパフォーマンスを改善しました。

  • プライマリリージョン以外のリージョンに保存されている Amazon S3 データをクエリする機能を追加しました。標準の Athena 料金に加えて、Amazon S3 の標準のリージョン間データ転送料金が適用されます。

バグ修正

  • パーティションがロードされないときに「テーブルが見つかりません」エラーが発生するバグを修正しました。

  • ALTER TABLE ADD PARTITION IF NOT EXISTS クエリで例外がスローされないようにバグを修正しました。

  • DROP PARTITIONS のバグを修正しました。

2017 年 2 月 20 日

公開日: 2017 年 02 月 20 日

AvroSerDe と OpenCSVSerDe、米国東部 (オハイオ) リージョン、およびコンソールウィザードでの列の一括編集のサポートを追加しました。大規模な Parquet テーブルのパフォーマンスを改善しました。

機能

  • 以下の新しい SerDe のサポートを導入しました。

  • 米国東部 (オハイオ) リージョン (us-east-2) での起動。このリージョンでクエリを実行できるようになりました。

  • これで [Create Table From S3 bucket data] (S3 バケットデータからテーブルを作成) フォームを使用して、テーブルスキーマを一括で定義できるようになりました。クエリエディタで [Create] (作成)、[S3 bucket data] (S3 バケットデータ) と選択し、さらに [Column details] (列の詳細) セクションの [Bulk add columns] (列の一括追加) を選択します。

    テキストボックスに名前と値のペアを入力し、[Add] を選択します。

改良点

  • 大規模な Parquet テーブルのパフォーマンスを改善しました。