计划 AWS Glue 爬网程序 - AWS Glue

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

计划 AWS Glue 爬网程序

您可以根据需要或定期计划运行 AWS Glue 爬网程序。爬网程序计划可以用 cron 格式表示。有关更多信息,请参阅 Wikipedia 中的 cron

当您根据计划创建爬网程序时,您可以指定包含约束,如爬网程序运行的频率、在一周中的那些天运行以及具体时间。这些约束基于 cron 。当您为设置爬网程序计划时,您应该考虑 cron 的功能和限制。例如,如果您选择在每月第 31 天运行您的爬网程序,请记住,有些月份没有 31 天。

每个爬网程序的爬取有效期最长为 12 个月

有关使用 cron 安排作业和爬网程序的更多信息,请参阅用于作业和爬网程序的基于时间的计划