本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
AWS Glue 常見問答集上的無伺服器 ETL
本節提供有關 上無伺服器 ETL 的常見問題解答 AWS Glue。
何時應使用 Python shell 而非 Apache Spark 執行 AWS Glue 任務?
當您有不需要 Apache Spark 分散式運算功能的基本 ETL 任務或小型資料集時,請使用 Python shell。使用 Apache Spark 進行更複雜的 ETL 任務或大型資料集,這些任務需要 Spark 最佳化處理的高處理能力。
我的專案的建議 AWS Glue 版本為何?
我們通常建議使用最新版本的 AWS Glue。AWS Glue 版本頁面列出版本之間的差異,以及其與各種 Python 和 Spark 版本的相容性。