CreateDatasetImportJob - Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

CreateDatasetImportJob

데이터 소스(S3 버킷)에서 Personalize 데이터세트로 학습 데이터를 가져오는 작업을 생성합니다. Personalize에서 학습 데이터를 가져오도록 허용하려면 Personalize가 데이터 사본을 만들어 내부적으로 처리하므로 데이터 소스에서 읽을 수 있는 권한이 있는 IAM 서비스 역할을 지정해야 합니다. S3 버킷에 대한 액세스 권한의 부여에 대한 자세한 내용은 S3 리소스에 대한 액세스 권한 Personalize에 부여 단원을 참조하세요.

이미 추천자를 생성했거나 캠페인과 함께 사용자 지정 솔루션 버전을 배포한 경우 새 대량 레코드가 추천에 미치는 영향은 사용하는 도메인 사용 사례 또는 레시피에 따라 달라집니다. 자세한 내용은 새 데이터가 실시간 추천에 미치는 영향 단원을 참조하세요.

중요

기본 설정으로 데이터세트 가져오기 작업은 대량으로 가져온 데이터세트의 기존 데이터를 대체합니다. 기존 데이터를 바꾸지 않고 새 레코드를 추가하려면 CreateDatasetImportJob 작업의 가져오기 모드로 INCREMENTAL을 지정하십시오.

상태

데이터세트 가져오기 작업은 다음 상태 중 하나일 수 있습니다.

  • CREATE PENDING > CREATE IN_PROGRESS > ACTIVE 또는 CREATE FAILED

가져오기 작업의 상태를 확인하려면 데이터세트 가져오기 작업의 Amazon 리소스 이름 (ARN) 을 제공하여 DescribeDatasetImportJob호출하십시오. 상태가 ACTIVE로 표시되면 데이터세트 가져오기가 완료된 것이고, 상태가 CREATE FAILED로 표시되는 경우 응답에는 작업이 실패한 이유를 설명하는 failureReason키가 포함됩니다.

참고

가져오기에는 시간이 필요합니다. 데이터세트를 사용하여 모델을 학습시키기 전에 상태가 ACTIVE로 나타날 때까지 기다려야 합니다.

구문 요청

{ "datasetArn": "string", "dataSource": { "dataLocation": "string" }, "importMode": "string", "jobName": "string", "publishAttributionMetricsToS3": boolean, "roleArn": "string", "tags": [ { "tagKey": "string", "tagValue": "string" } ] }

요청 파라미터

요청은 JSON 형식으로 다음 데이터를 받습니다.

datasetArn

가져온 데이터를 수신하는 데이터세트의 ARN입니다.

타입: 문자열

길이 제약: 최대 길이 256.

패턴: arn:([a-z\d-]+):personalize:.*:.*:.+

필수 사항 여부: Yes

dataSource

가져올 학습 데이터가 들어 있는 S3 버킷.

유형: DataSource객체

필수 여부: 예

importMode

기존 데이터세트에 새 레코드를 추가하는 방법을 지정합니다. 기본 가져오기 모드는 FULL입니다. 이전에 데이터세트로 대량 레코드를 가져온 적이 없는 경우 FULL만 지정할 수 있습니다.

  • 데이터세트의 기존 대량 데이터를 모두 덮어쓰려면 FULL을 지정합니다. 개별적으로 가져온 데이터는 대체되지 않습니다.

  • 새 레코드를 데이터세트의 기존 데이터에 추가하려면 INCREMENTAL을 지정합니다. Personalize는 동일한 ID를 가진 모든 레코드를 새 레코드로 대체합니다.

타입: 문자열

유효 값: FULL | INCREMENTAL

필수 여부: 아니요

jobName

데이터세트 가져오기 작업의 이름.

유형: 문자열

길이 제약: 최소 길이 1. 최대 길이 63.

패턴: ^[a-zA-Z0-9][a-zA-Z0-9\-_]*

필수 사항 여부: Yes

publishAttributionMetricsToS3

지표 어트리뷰션을 생성한 경우 이 가져오기 작업에 대한 지표를 S3에 게시할지 여부를 지정합니다

타입: 부울

필수 항목 여부: 아니요

roleArn

S3 데이터 소스에서 읽을 권한이 있는 IAM 역할의 ARN입니다.

타입: 문자열

길이 제약: 최대 길이 256.

패턴: arn:([a-z\d-]+):iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+

필수 사항 여부: Yes

tags

데이터세트 가져오기 작업에 적용할 태그의 목록입니다.

유형: Tag객체 어레이

어레이 멤버: 최소 항목 수 0개. 최대 항목 수 200개.

필수 여부: 아니요

응답 구문

{ "datasetImportJobArn": "string" }

응답 요소

작업이 성공하면 서비스가 HTTP 200 응답을 반송합니다.

다음 데이터는 서비스에 의해 JSON 형식으로 반환됩니다.

datasetImportJobArn

데이터세트 가져오기 작업의 ARN입니다.

타입: 문자열

길이 제약: 최대 길이 256.

패턴: arn:([a-z\d-]+):personalize:.*:.*:.+

Errors

InvalidInputException

필드 또는 파라미터에 유효한 값을 제공합니다.

HTTP 상태 코드: 400

LimitExceededException

초당 요청 수 한도를 초과했습니다.

HTTP 상태 코드: 400

ResourceAlreadyExistsException

지정된 리소스가 이미 있습니다.

HTTP 상태 코드: 400

ResourceInUseException

지정된 리소스가 이미 사용 중입니다.

HTTP 상태 코드: 400

ResourceNotFoundException

지정된 리소스를 찾을 수 없습니다.

HTTP 상태 코드: 400

TooManyTagsException

이 리소스에 적용할 수 있는 최대 태그 수를 초과했습니다.

HTTP 상태 코드: 400

참고

언어별 AWS SDK 중 하나에서 이 API를 사용하는 방법에 대한 자세한 내용은 다음을 참조하십시오.