크롤러 스케줄러 API
크롤러 스케줄러 API는 크롤러를 생성, 삭제, 업데이트 및 나열하기 위한 API와 함께 AWS Glue 크롤러 데이터 유형에 대해 설명합니다.
데이터 타입
일정 구조
cron
을 사용하여 객체의 일정을 정하여 이벤트의 일정을 정합니다.
필드
-
ScheduleExpression
– UTF-8 문자열입니다.일정을 지정하는 데 사용되는
cron
표현식입니다(작업 및 크롤러의 시간 기반 일정 참조). 예를 들어, 매일 오후 12시 15분(UTC)에 실행하려면cron(15 12 * * ? *)
을 지정합니다. -
State
– UTF-8 문자열입니다(유효 값:SCHEDULED
|NOT_SCHEDULED
|TRANSITIONING
).일정 상태
운영
UpdateCrawlerSchedule 작업(Python: start_crawler_schedule)
cron
표현식을 사용하여 크롤러의 일정을 업데이트합니다.
요청
-
CrawlerName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.업데이트할 일정이 있는 크롤러 이름입니다.
-
Schedule
– UTF-8 문자열입니다.일정을 지정하는 데 사용되는 업데이트된
cron
표현식입니다(작업 및 크롤러의 시간 기반 일정 참조). 예를 들어, 매일 오후 12시 15분(UTC)에 실행하려면cron(15 12 * * ? *)
을 지정합니다.
응답
무응답 파라미터.
Errors
EntityNotFoundException
InvalidInputException
VersionMismatchException
SchedulerTransitioningException
OperationTimeoutException
StartCrawlerSchedule 작업(Python: start_crawler_schedule)
크롤러가 실행 중이거나 일정 상태가 이미 SCHEDULED
로 되어있지 않는 한 지정된 크롤러의 일정 상태를 SCHEDULED
로 변경합니다.
요청
-
CrawlerName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.일정을 잡을 크롤러의 이름.
응답
무응답 파라미터.
Errors
EntityNotFoundException
SchedulerRunningException
SchedulerTransitioningException
NoScheduleException
OperationTimeoutException
StopCrawlerSchedule 작업(Python: stop_crawler_schedule)
지정된 크롤러의 일정 상태를 NOT_SCHEDULED
로 설정하지만 크롤러가 실행되고 있으면 크롤러를 중지하지 않습니다.
요청
-
CrawlerName
– 필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.설정할 일정이 있는 크롤러 이름.
응답
무응답 파라미터.
Errors
EntityNotFoundException
SchedulerNotRunningException
SchedulerTransitioningException
OperationTimeoutException