As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Execuções programadas e baseadas em eventos para pipelines do Processador de atributos
As execuções do pipeline de processamento de recursos do Amazon SageMaker Feature Store podem ser configuradas para serem iniciadas de forma automática e assíncrona com base em uma programação pré-configurada ou como resultado de outro evento de serviço. AWS Por exemplo, você pode programar pipelines de processamento de atributos para serem executados no primeiro dia de cada mês ou encadear dois pipelines juntos para que um pipeline de destino seja executado automaticamente após a conclusão da execução do pipeline de origem.
Execuções baseadas em programação
O Feature Processor SDK fornece um recurso schedule
cron
expressão at
rate
,, ou usando o ScheduleExpression
parâmetro com as mesmas expressões suportadas pela Amazon EventBridge. O cronograma API é semanticamente uma operação invertida, pois atualiza o cronograma, se ele já existir; caso contrário, ele o cria. Para obter mais informações sobre EventBridge expressões e exemplos, consulte Tipos de EventBridge agendamento no Scheduler no Guia do usuário do EventBridge Scheduler.
Os exemplos a seguir usam o Feature Processor schedule
at
rate
, usando as cron
expressões, e.
from sagemaker.feature_store.feature_processor import schedule pipeline_name='feature-processor-pipeline' event_bridge_schedule_arn = schedule( pipeline_name=pipeline_name, schedule_expression="at(2020-11-30T00:00:00)" ) event_bridge_schedule_arn = schedule( pipeline_name=pipeline_name, schedule_expression="rate(24 hours)" ) event_bridge_schedule_arn = schedule( pipeline_name=pipeline_name, schedule_expression="cron(0 0-23/1 ? * * 2023-2024)" )
O fuso horário padrão para as entradas de data e hora no schedule
API estão em. UTC Para obter mais informações sobre expressões de EventBridge agendamento do Scheduler, consulte a documentação ScheduleExpression
de API referência do EventBridge Scheduler.
As execuções programadas do pipeline do Processador de atributos fornecem à sua função de transformação o tempo de execução programado, para ser usado como um token de idempotência ou um ponto de referência fixo para entradas baseadas em intervalos de datas. Para desativar (ou seja, pausar) ou reativar um agendamento, use o state
parâmetro schedule
‘DISABLED’
ou‘ENABLED’
, respectivamente.
Para obter mais informações sobre o Processador de atributos, consulte Fontes de SDK dados do Feature Processor.
Execuções baseadas em eventos
Um pipeline de processamento de recursos pode ser configurado para ser executado automaticamente quando um evento AWS
ocorrer. O Feature Processing SDK fornece uma put_trigger
FeatureProcessorPipelineEvent
A put_trigger
função configura uma EventBridge regra e uma meta da Amazon para rotear eventos e permite que você especifique um padrão de EventBridge evento para responder a qualquer AWS evento. Para obter informações sobre esses conceitos, consulte EventBridge as regras, metas e padrões de eventos da Amazon.
Os gatilhos podem ser ativados ou desativados. EventBridge iniciará a execução de um pipeline de destino usando a função fornecida no role_arn
parâmetro do put_trigger
API. A função de execução é usada por padrão se SDK for usada em um ambiente Amazon SageMaker Studio Classic ou Notebook. Para obter informações sobre como obter sua função de execução, consulteObtenha sua função de execução.
O exemplo a seguir define:
-
Um SageMaker pipeline usando o
to_pipeline
API, que inclui o nome do pipeline de destino (target-pipeline
) e sua função de transformação (transform
). Para obter informações sobre seu Processador de atributos e a função de transformação, consulte Fontes de SDK dados do Feature Processor. -
Um gatilho usando o
put_trigger
API, que absorveFeatureProcessorPipelineEvent
o evento e o nome do seu pipeline de destino (target-pipeline
).O
FeatureProcessorPipelineEvent
define o gatilho para quando o status do seu pipeline de origem (source-pipeline
) se tornaSucceeded
. Para obter informações sobre a função de evento do Pipeline do Processador de atributos, consulteFeatureProcessorPipelineEvent
na seção Ler os documentos da Feature Store.
from sagemaker.feature_store.feature_processor import put_trigger, to_pipeline, FeatureProcessorPipelineEvent to_pipeline(pipeline_name="target-pipeline", step=transform) put_trigger( source_pipeline_events=[ FeatureProcessorPipelineEvent( pipeline_name="source-pipeline", status=["Succeeded"] ) ], target_pipeline="target-pipeline" )
Para obter um exemplo do uso de gatilhos baseados em eventos para criar execuções contínuas e novas tentativas automáticas para seu pipeline do Processador de atributos, consulte Execuções contínuas e novas tentativas automáticas usando gatilhos baseados em eventos.
Para obter um exemplo do uso de gatilhos baseados em eventos para criar streaming contínuo e novas tentativas automáticas usando gatilhos baseados em eventos, consulte Exemplos de fontes de dados personalizadas de streaming.