本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
轉換為單欄式格式
若您將資料轉換為開放原始碼單欄式格式,例如 Apache Parquet
將 JSON 或 CSV 等來源資料輕鬆轉換為單欄式格式的選項,包括使用 CREATE TABLE AS 查詢或執行 AWS Glue中的任務。
-
使用
CREATE TABLE AS
(CTAS) 查詢,只需一個步驟即可將資料轉換為 Parquet 或 ORC。如需範例,請參閱 CTAS 查詢的範例 頁面上的範例:將查詢結果寫為不同格式。 -
如需執行 AWS Glue 任務以將 CSV 資料轉換為 Parquet 的詳細資訊,請參閱 AWS 大數據部落格文章使用 AWS Glue 和 Amazon S3 建立資料湖基礎中的「將資料從 CSV 轉換為實木複合地板格式」一
節。 AWS Glue 支持使用相同的技術將 CSV 數據轉換為 ORC,或者將 JSON 數據轉換為實木複合地板或 ORC。