本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
常见问题解答中的无服务器 ETL AWS Glue
该节提供了有关在 AWS Glue上无服务器 ETL 的常见问题解答。
我什么时候应该使用 Python shell 而不是 Apache Spark 来完成作 AWS Glue 业?
当你有基本 ETL 任务或不需要 Apache Spark 分布式计算功能的小型数据集时,可以使用 Python shell。使用 Apache Spark 处理更复杂的 ETL 作业或需要高处理能力的大型数据集,而 Spark 经过优化,可以处理这些任务。
我的项目的推荐 AWS Glue 版本是什么?
我们通常建议使用最新版本的 AWS Glue。AWS Glue 版本页面列出了版本之间的差异,以及它们与各种版本的 Python 和 Spark 的兼容性。