Crie um Streaming Labeling Job com a SageMaker API - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Crie um Streaming Labeling Job com a SageMaker API

Veja a seguir um exemplo de uma AWS Solicitação do Python SDK (Boto3) que você pode usar para iniciar um trabalho de rotulagem de streaming na região Leste dos EUA (Norte da Virgínia). Para obter mais detalhes sobre cada parâmetro abaixo, consulte CreateLabelingJob. Para saber como criar um trabalho de rotulagem usando essa API e a linguagem específica associada SDKs, consulte Create a Labeling Job (API).

Nesse exemplo, observe os seguintes parâmetros:

  • SnsDataSource: Esse parâmetro aparece em InputConfig e OutputConfig e é usado para identificar seus tópicos de entrada e saída do Amazon SNS, respectivamente. Para criar um trabalho de rotulagem de streaming, você deve fornecer um tópico de entrada do Amazon SNS. Você também pode, opcionalmente, fornecer um tópico de saída do Amazon SNS.

  • S3DataSource: Esse parâmetro é opcional. Use esse parâmetro se quiser incluir um arquivo de manifesto de entrada de objetos de dados que você deseja rotular assim que o trabalho de rotulagem começar.

  • StoppingConditions: Esse parâmetro é ignorado quando você cria um trabalho de rotulagem de streaming. Para saber mais sobre como interromper um trabalho de rotulagem de streaming, consulte Interromper um trabalho de rotulagem de streaming.

  • Os trabalhos de rotulagem de streaming não são compatíveis com a rotulagem de dados automatizada. Não inclua o parâmetro LabelingJobAlgorithmsConfig.

response = client.create_labeling_job( LabelingJobName= 'example-labeling-job', LabelAttributeName='label', InputConfig={ 'DataSource': { 'S3DataSource': { 'ManifestS3Uri': 's3://bucket/path/manifest-with-input-data.json' }, 'SnsDataSource': { 'SnsTopicArn': 'arn:aws:sns:us-east-1:123456789012:your-sns-input-topic' } }, 'DataAttributes': { 'ContentClassifiers': [ 'FreeOfPersonallyIdentifiableInformation'|'FreeOfAdultContent', ] } }, OutputConfig={ 'S3OutputPath': 's3://bucket/path/file-to-store-output-data', 'KmsKeyId': 'string', 'SnsTopicArn': 'arn:aws:sns:us-east-1:123456789012:your-sns-output-topic' }, RoleArn='arn:aws:iam::*:role/*', LabelCategoryConfigS3Uri='s3://bucket/path/label-categories.json', HumanTaskConfig={ 'WorkteamArn': 'arn:aws:sagemaker:us-east-1:*:workteam/private-crowd/*', 'UiConfig': { 'UiTemplateS3Uri': 's3://bucket/path/custom-worker-task-template.html' }, 'PreHumanTaskLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:PRE-tasktype', 'TaskKeywords': [ 'Example key word', ], 'TaskTitle': 'Multi-label image classification task', 'TaskDescription': 'Select all labels that apply to the images shown', 'NumberOfHumanWorkersPerDataObject': 123, 'TaskTimeLimitInSeconds': 123, 'TaskAvailabilityLifetimeInSeconds': 123, 'MaxConcurrentTaskCount': 123, 'AnnotationConsolidationConfig': { 'AnnotationConsolidationLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:ACS-tasktype' } }, Tags=[ { 'Key': 'string', 'Value': 'string' }, ] )