本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
瞭解資料表、資料庫和資料目錄
在 Athena 中,目錄、資料庫和資料表都是中繼資料定義的容器,可定義基礎來源資料的結構描述。
Athena 使用下列術語來表示資料物件的階層:
-
資料來源— 一組數據庫
-
資料庫— 一組桌子
-
表格-組織為一組行或列的數據
有時候,這些物件也會以替代但對等的名稱來參照,如下所示:
-
資料來源有時稱為目錄。
-
資料庫有時稱為模式。
注意
這個術語可能會因您搭配 Athena 使用的聯合資料來源而有所不同。如需詳細資訊,請參閱雅典娜和聯合表名資格賽。
下列 Athena 主控台中的範例查詢會使用awsdatacatalog
資料來源,default
資料庫,以及some_table
表。

對於每個資料集,Athena 中必須存在資料表。資料表中的中繼資料可讓 Athena 知道資料位於 Amazon S3 中的何處,並指定資料的結構,例如資料欄名稱、資料類型和資料表名稱。資料庫是資料表的邏輯群組,也只保存資料集的中繼資料和結構描述資訊。
對於您想要查詢的每個資料集,Athena 必須有基礎資料表,以用於取得和傳回查詢結果。因此,在查詢資料之前,必須在 Athena 中註冊資料表。註冊是在您自動或手動建立資料表時進行。
您可以使用自動建立表格AWS Glue爬蟲。如需有關 AWS Glue 和爬蟲程式的詳細資訊,請參閱與 AWS Glue 整合。當 AWS Glue 建立資料表時,其會在自己的 AWS Glue 資料目錄中註冊資料表。Athena 使用 AWS Glue 資料目錄來存放和擷取此中繼資料,供您執行查詢以分析基礎資料集時使用。
無論資料表的建立方式為何,資料表建立程序都會向 Athena 註冊資料集。此註冊會在 AWS Glue Data Catalog 中進行,並可讓 Athena 對資料執行查詢。在 Athena 查詢編輯器中,此目錄 (或資料來源) 與標籤一起參照AwsDataCatalog
。
在建立資料表之後,您可以使用 SQL SELECT 陳述式來查詢該資料表,包括取得來源資料的特定檔案位置。您的查詢結果會存放在 Amazon S3 中您指定的查詢結果位置。
您可以透過整個 Amazon Web Services 帳戶存取該 AWS Glue 資料目錄。其他 AWS 服務 可以共用 AWS Glue 資料目錄,因此,您可以使用 Athena 查看整個組織中建立的資料庫和資料表,反之亦然。
-
手動建立資料表:
-
使用 Athena 主控台執行建立資料表精靈。
-
使用 Athena 主控台在查詢編輯器中撰寫 Hive DDL 陳述式。
-
使用 Athena API 或 CLI,以執行採用 DDL 陳述式的 SQL 查詢字串。
-
使用 Athena JDBC 或 ODBC 驅動程式。
-
手動建立資料表和資料庫時,Athena 會在幕後使用 HiveQL 資料定義語言 (DDL) 陳述式 (例如 CREATE TABLE
、CREATE DATABASE
和 DROP TABLE
),在 AWS Glue Data Catalog 中建立資料表和資料庫。
若要開始使用,您可以在 Athena 主控台中使用教學課程,或透過step-by-step雅典娜文檔中的指南。
-
若要在 Athena 主控台中使用教學課程,請選擇主機右上角的資訊圖示,然後選擇教程標籤。
-
對於一個step-by-step如何在 Athena 查詢編輯器中建立資料表和撰寫查詢的教學課程,請參閱入門。