API del programador del rastreador - AWS Glue

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

API del programador del rastreador

La API del programador de rastreadores describe los tipos de datos de rastreadores de AWS Glue, junto con la API para crear, eliminar, actualizar y ver listas de rastreadores.

Tipos de datos

Estructura de programación

Objeto de programación que usa una instrucción cron para programar un evento.

Campos
  • ScheduleExpression: cadena UTF-8.

    Expresión cron utilizada para especificar el programa (consulte Programaciones basadas en tiempo para trabajos y rastreadores). Por ejemplo, para ejecutar algo todos los días a las 12:15 UTC, especifique: cron(15 12 * * ? *).

  • State: cadena UTF-8 (valores válidos: SCHEDULED | NOT_SCHEDULED | TRANSITIONING).

    Estado del programa.

Operaciones

Acción UpdateCrawlerSchedule (Python: update_crawler_schedule)

Actualiza la programación de un rastreador mediante una expresión cron.

Solicitud
  • CrawlerName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    El nombre del rastreador cuya programación se debe actualizar.

  • Schedule: cadena UTF-8.

    La expresión cron actualizada que se utiliza para especificar el programa (consulte el tema sobre programaciones basadas en tiempo para trabajos y rastreadores). Por ejemplo, para ejecutar algo todos los días a las 12:15 UTC, especifique: cron(15 12 * * ? *).

Respuesta
  • Sin parámetros de respuesta.

Errores
  • EntityNotFoundException

  • InvalidInputException

  • VersionMismatchException

  • SchedulerTransitioningException

  • OperationTimeoutException

Acción StartCrawlerSchedule (Python: start_crawler_schedule)

Cambia el estado de programación del rastreador especificado para SCHEDULED, salvo que el rastreador ya se esté ejecutando o el estado de programación ya esté en SCHEDULED.

Solicitud
  • CrawlerName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Nombre del rastreador que se va a programar.

Respuesta
  • Sin parámetros de respuesta.

Errores
  • EntityNotFoundException

  • SchedulerRunningException

  • SchedulerTransitioningException

  • NoScheduleException

  • OperationTimeoutException

Acción StopCrawlerSchedule (Python: stop_crawler_schedule)

Establece el estado del programador del rastreador especificado en NOT_SCHEDULED, pero no detiene el rastreador si ya se está ejecutando.

Solicitud
  • CrawlerName: obligatorio: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el Single-line string pattern.

    Nombre del rastreador cuyo estado de programación se va a definir.

Respuesta
  • Sin parámetros de respuesta.

Errores
  • EntityNotFoundException

  • SchedulerNotRunningException

  • SchedulerTransitioningException

  • OperationTimeoutException