Amazon Forecast는 더 이상 신규 고객에게 제공되지 않습니다. Amazon Forecast의 기존 고객은 서비스를 정상적으로 계속 사용할 수 있습니다. 자세히 알아보기
기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
CreateDatasetImportJob
Amazon Forecast 데이터 세트로 훈련 데이터를 가져옵니다. Amazon Simple Storage Service (Amazon S3) 버킷의 교육 데이터 위치와 데이터를 가져올 대상 데이터세트의 Amazon 리소스 이름 ARN () 을 입력합니다.
중요
신규 고객은 더 이상 Amazon Forecast를 사용할 수 없습니다. Amazon Forecast의 기존 고객은 서비스를 정상적으로 계속 사용할 수 있습니다. 자세히 알아보기
Amazon Forecast는 데이터 사본을 만들어 내부 AWS 시스템에서 처리하므로 Amazon Forecast가 데이터에 액세스하기 위해 맡을 수 있는 AWS Identity and Access Management (IAM) 역할을 포함하는 DataSource객체를 지정해야 합니다. 자세한 내용은 권한 설정을 참조하세요.
교육 데이터는 CSV 또는 Parquet 형식이어야 합니다. 구분자는 쉼표(,)여야 합니다.
예를 들어 특정 파일, S3 버킷 또는 S3 버킷 내 폴더로 경로를 지정할 수 있습니다. 뒤의 두 가지 경우, Amazon Forecast는 최대 10,000개 파일 한도까지 모든 파일을 가져옵니다.
데이터 세트 가져오기는 집계되지 않으므로 예측기를 훈련하거나 예측을 생성할 때 가장 최근 데이터 세트 가져오기가 사용됩니다. 가장 최근 데이터 세트 가져오기에 이전 가져오기 이후 수집된 새 데이터뿐만 아니라 모델링하려는 모든 데이터가 포함되어 있는지 확인합니다.
지정된 기준으로 필터링된 모든 데이터세트 가져오기 작업의 목록을 가져오려면 작업을 사용하세요. ListDatasetImportJobs
구문 요청
{
"DatasetArn": "string
",
"DatasetImportJobName": "string
",
"DataSource": {
"S3Config": {
"KMSKeyArn": "string
",
"Path": "string
",
"RoleArn": "string
"
}
},
"Format": "string
",
"GeolocationFormat": "string
",
"ImportMode": "string
",
"Tags": [
{
"Key": "string
",
"Value": "string
"
}
],
"TimestampFormat": "string
",
"TimeZone": "string
",
"UseGeolocationForTimeZone": boolean
}
요청 파라미터
요청은 다음 데이터를 JSON 포맷으로 수락합니다.
- DatasetArn
-
데이터를 가져오려는 Amazon Forecast 데이터세트의 Amazon 리소스 이름 (ARN).
유형: 문자열
길이 제약: 최대 길이 256.
Pattern:
arn:([a-z\d-]+):forecast:.*:.*:.+
필수 여부: 예
- DatasetImportJobName
-
데이터세트 가져오기 작업의 이름. 이름에 현재 타임스탬프를 포함하는 것이 좋습니다(예:
20190721DatasetImport
). 이렇게 하면ResourceAlreadyExistsException
예외가 발생하지 않도록 할 수 있습니다.유형: 문자열
길이 제약: 최소 길이 1. 최대 길이 63.
Pattern:
^[a-zA-Z][a-zA-Z0-9_]*
필수 여부: 예
- DataSource
-
가져올 교육 데이터의 위치 및 데이터에 액세스하기 위해 Amazon Forecast가 맡을 수 있는 AWS Identity and Access Management (IAM) 역할. 훈련 데이터는 Amazon S3 버킷에 저장해야 합니다.
암호화를 사용하는 경우 AWS Key Management Service (KMS) 키를
DataSource
포함해야 하며 IAM 역할은 Amazon Forecast에서 키에 액세스할 수 있는 권한을 허용해야 합니다. KMS키와 IAM 역할은 CreateDataset작업EncryptionConfig
파라미터에 지정된 것과 일치해야 합니다.유형: DataSource 객체
필수 여부: 예
- Format
-
가져온 데이터의 형식 CSV 또는PARQUET. 기본값은 입니다CSV.
유형: 문자열
길이 제약 조건: 최대 길이는 7입니다.
패턴:
^CSV|PARQUET$
Required: No
- GeolocationFormat
-
지리적 위치 속성의 형식입니다. 다음 두 가지 방법 중 하나로 지리적 위치 속성의 형식을 지정할 수 있습니다.
-
LAT_LONG
- 10진수 형식의 위도 및 경도(예: 47.61_-122.33). -
CC_POSTALCODE
(미국만 해당) - 국가 코드 (미국), 그 뒤에 5자리 ZIP 코드 (예: US_98121) 가 옵니다.
유형: 문자열
길이 제약: 최대 길이 256.
패턴:
^[a-zA-Z0-9_]+$
Required: No
-
- ImportMode
-
데이터 세트 가져오기 작업이
FULL
가져오기인지INCREMENTAL
가져오기인지 지정합니다.FULL
데이터 세트 가져오기는 기존 데이터를 모두 새로 가져온 데이터로 대체합니다.INCREMENTAL
가져오기는 가져온 데이터를 기존 데이터에 추가합니다.타입: 문자열
유효 값:
FULL | INCREMENTAL
필수 여부: 아니요
- Tags
-
데이터 세트 가져오기 작업을 분류하고 구성하는 데 도움이 되도록 데이터 세트 가져오기 작업에 적용하는 선택적 메타데이터입니다. 각 태그는 사용자가 정의하는 키와 선택적 값으로 구성됩니다.
태그에 적용되는 기본 제한은 다음과 같습니다.
-
리소스당 최대 태그 수 - 50개.
-
각 리소스에 대해 각 태그 키는 고유하며 하나의 값만 가질 수 있습니다.
-
최대 키 길이는 유니코드 문자 128자 (-8) 입니다. UTF
-
최대 값 길이 - 유니코드 문자 256자 (-8) UTF
-
태그 지정 스키마를 여러 서비스와 리소스에서 사용하는 경우 다른 서비스에서 허용되는 문자에 제한이 있을 수 있음에 유의하세요. 일반적으로 허용되는 문자는 UTF -8로 표현할 수 있는 문자, 숫자, 공백과 + - =. _:/@ 문자입니다.
-
태그 키와 값은 대소문자를 구분합니다.
-
키 접두사 등의 대문자 또는 소문자 조합은 사용하도록 예약되어 있으므로 사용하지
aws:
마십시오.AWS:
AWS 이 접두사가 있는 태그 키는 편집하거나 삭제할 수 없습니다. 값에 이 접두사가 포함될 수 있습니다. 태그 값에는 접두사로aws
가 있지만 키에는 없는 경우 Forecast는 해당 태그를 사용자 태그로 간주하여 50개 태그 한도에 포함합니다.aws
키 접두사만 있는 태그는 리소스당 태그 수 한도에 포함되지 않습니다.
유형: Tag객체 어레이
어레이 멤버: 최소 항목 수 0개. 최대 항목 수 200개.
필수 여부: 아니요
-
- TimestampFormat
-
데이터 세트의 타임스탬프 형식입니다. 지정하는 형식은 데이터 세트가 생성될 때 지정한
DataFrequency
에 따라 달라집니다. 지원되는 형식은 다음과 같습니다.-
"yyyy-MM-dd"
다음 데이터 빈도의 경우: Y, M, W, D
-
"yyyy-MM-dd HH:mm:ss"
다음 데이터 빈도의 경우: H, 30분, 15분, 1분 및 선택적으로 Y, M, W, D
형식이 지정되지 않은 경우 Amazon Forecast는 형식이 “yyyy-MM-dd HH:mm:ss”일 것으로 예상합니다.
유형: 문자열
길이 제약: 최대 길이 256.
패턴:
^[a-zA-Z0-9\-\:\.\,\'\s]+$
Required: No
-
- TimeZone
-
데이터 세트의 모든 항목의 단일 시간대. 이 옵션은 모든 타임스탬프가 단일 시간대 내에 있는 데이터 세트 또는 모든 타임스탬프가 단일 시간대로 정규화된 경우에 적합합니다.
유효한 시간대 이름의 전체 목록은 Joda-Time을 API
참조하십시오. 유형: 문자열
길이 제약: 최대 길이 256.
패턴:
^[a-zA-Z0-9\/\+\-\_]+$
Required: No
- UseGeolocationForTimeZone
-
지리적 위치 속성에서 시간대 정보를 자동으로 추출합니다. 이 옵션은 여러 시간대의 타임스탬프가 포함되어 있고 이러한 타임스탬프가 현지 시간으로 표시되는 데이터 세트에 적합합니다.
타입: 부울
필수 항목 여부: 아니요
응답 구문
{
"DatasetImportJobArn": "string"
}
Response Elements
작업이 성공하면 서비스는 HTTP 200 응답을 다시 보냅니다.
서비스는 다음 데이터를 JSON 형식으로 반환합니다.
- DatasetImportJobArn
-
데이터세트 가져오기 작업의 Amazon 리소스 이름 (ARN)
유형: 문자열
길이 제약: 최대 길이 256.
패턴:
arn:([a-z\d-]+):forecast:.*:.*:.+
Errors
- InvalidInputException
-
요청에 잘못된 값이나 유효한 범위를 초과하는 값이 포함되어 있기 때문에 요청을 처리할 수 없습니다.
HTTP상태 코드: 400
- LimitExceededException
-
계정당 리소스 수 제한을 초과했습니다.
HTTP상태 코드: 400
- ResourceAlreadyExistsException
-
이 이름을 가진 리소스가 이미 있습니다. 다른 이름으로 다시 시도하세요.
HTTP상태 코드: 400
- ResourceInUseException
-
지정된 리소스가 이미 사용 중입니다.
HTTP상태 코드: 400
- ResourceNotFoundException
-
해당 Amazon 리소스 이름 (ARN) 을 가진 리소스를 찾을 수 없습니다. 를 ARN 확인하고 다시 시도하십시오.
HTTP상태 코드: 400
참고
언어별 사용 방법에 대한 자세한 내용은 AWS SDKs 다음을 참조하십시오. API