크롤러 스케줄러 API - AWS Glue

크롤러 스케줄러 API

크롤러 스케줄러 API는 크롤러를 생성, 삭제, 업데이트 및 나열하기 위한 API와 함께 AWS Glue 크롤러 데이터 유형에 대해 설명합니다.

데이터 유형

일정 구조

cron을 사용하여 객체의 일정을 정하여 이벤트의 일정을 정합니다.

필드
  • ScheduleExpression – UTF-8 문자열입니다.

    일정을 지정하는 데 사용되는 cron 표현식입니다(작업 및 크롤러의 시간 기반 일정 참조). 예를 들어, 매일 오후 12시 15분(UTC)에 실행하려면 cron(15 12 * * ? *)을 지정합니다.

  • State – UTF-8 문자열입니다(유효 값: SCHEDULED | NOT_SCHEDULED | TRANSITIONING).

    일정 상태

작업

UpdateCrawlerSchedule 작업(Python: start_crawler_schedule)

cron 표현식을 사용하여 크롤러의 일정을 업데이트합니다.

요청
  • CrawlerName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    업데이트할 일정이 있는 크롤러 이름입니다.

  • Schedule – UTF-8 문자열입니다.

    일정을 지정하는 데 사용되는 업데이트된 cron 표현식입니다(작업 및 크롤러의 시간 기반 일정 참조). 예를 들어, 매일 오후 12시 15분(UTC)에 실행하려면 cron(15 12 * * ? *)을 지정합니다.

응답
  • 무응답 파라미터.

오류
  • EntityNotFoundException

  • InvalidInputException

  • VersionMismatchException

  • SchedulerTransitioningException

  • OperationTimeoutException

StartCrawlerSchedule 작업(Python: start_crawler_schedule)

크롤러가 실행 중이거나 일정 상태가 이미 SCHEDULED로 되어있지 않는 한 지정된 크롤러의 일정 상태를 SCHEDULED로 변경합니다.

요청
  • CrawlerName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    일정을 잡을 크롤러의 이름.

응답
  • 무응답 파라미터.

오류
  • EntityNotFoundException

  • SchedulerRunningException

  • SchedulerTransitioningException

  • NoScheduleException

  • OperationTimeoutException

StopCrawlerSchedule 작업(Python: stop_crawler_schedule)

지정된 크롤러의 일정 상태를 NOT_SCHEDULED로 설정하지만 크롤러가 실행되고 있으면 크롤러를 중지하지 않습니다.

요청
  • CrawlerName필수(Required): Single-line string pattern과(와) 일치하는 1~255바이트 길이의 UTF-8 문자열입니다.

    설정할 일정이 있는 크롤러 이름.

응답
  • 무응답 파라미터.

오류
  • EntityNotFoundException

  • SchedulerNotRunningException

  • SchedulerTransitioningException

  • OperationTimeoutException