Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
API del pianificatore del crawler
L'API del pianificatore del crawler descrive i tipi di dati delle ricerche per indicizzazione AWS Glue e l'API per la loro creazione, eliminazione, aggiornamento ed elenco.
Tipi di dati
Struttura della pianificazione
Oggetto di pianificazione che utilizza una dichiarazione cron
per pianificare un evento.
Campi
-
ScheduleExpression
: stringa UTF-8.Espressione
cron
usata per specificare la pianificazione (consulta Pianificazioni basate sul tempo per processi e crawler. Ad esempio, per eseguire un processo ogni giorno alle 12:15 UTC, devi specificare:cron(15 12 * * ? *)
. -
State
: stringa UTF-8 (valori validi:SCHEDULED
|NOT_SCHEDULED
|TRANSITIONING
).Lo stato della pianificazione.
Operazioni
Operazione UpdateCrawlerSchedule (Python: update_crawler_schedule)
Aggiorna la pianificazione di un crawler utilizzando un'espressione cron
.
Richiesta
-
CrawlerName
: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.Nome del crawler la cui programmazione è da aggiornare.
-
Schedule
: stringa UTF-8.Espressione
cron
aggiornata usata per specificare la pianificazione, consulta Pianificazioni basate sul tempo per processi e crawler. Ad esempio, per eseguire un processo ogni giorno alle 12:15 UTC, devi specificare:cron(15 12 * * ? *)
.
Risposta
Nessun parametro di risposta.
Errori
EntityNotFoundException
InvalidInputException
VersionMismatchException
SchedulerTransitioningException
OperationTimeoutException
Operazione StartCrawlerSchedule (Python: start_crawler_schedule)
Cambia lo stato della pianificazione del crawler specificato su SCHEDULED
, a meno che il crawler non sia già in esecuzione o lo stato della pianificazione sia già impostata su SCHEDULED
.
Richiesta
-
CrawlerName
: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.Nome del crawler da pianificare.
Risposta
Nessun parametro di risposta.
Errori
EntityNotFoundException
SchedulerRunningException
SchedulerTransitioningException
NoScheduleException
OperationTimeoutException
Operazione StopCrawlerSchedule (Python: stop_crawler_schedule)
Imposta lo stato della pianificazione del crawler specificato su NOT_SCHEDULED
, ma non arresta il crawler se è già in esecuzione.
Richiesta
-
CrawlerName
: obbligatorio: stringa UTF-8, non inferiore a 1 o superiore a 255 byte di lunghezza, corrispondente a Single-line string pattern.Nome del crawler il cui stato della programmazione è da impostare.
Risposta
Nessun parametro di risposta.
Errori
EntityNotFoundException
SchedulerNotRunningException
SchedulerTransitioningException
OperationTimeoutException