DiscoverInputSchema - Amazon Managed Service for Apache Flink(이전의 Amazon Kinesis Data Analytics for Apache Flink)

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

DiscoverInputSchema

지정된 스트리밍 소스 (Kinesis 데이터 스트림 또는 Kinesis Data Firehose 전송 스트림) 또는 Amazon S3 객체의 샘플 레코드를 평가하여 SQL 기반 Kinesis 데이터 분석 애플리케이션의 스키마를 유추합니다. 응답에서 작업은 추론된 스키마와 작업에서 스키마를 추론하는 데 사용한 샘플 레코드를 반환합니다.

애플리케이션의 스트리밍 소스를 구성할 때 유추된 스키마를 사용할 수 있습니다. Kinesis Data Analytics 콘솔을 사용하여 애플리케이션을 생성하면 콘솔은 이 작업을 사용하여 스키마를 유추하고 콘솔 사용자 인터페이스에 표시합니다.

구문 요청

{ "InputProcessingConfiguration": { "InputLambdaProcessor": { "ResourceARN": "string" } }, "InputStartingPositionConfiguration": { "InputStartingPosition": "string" }, "ResourceARN": "string", "S3Configuration": { "BucketARN": "string", "FileKey": "string" }, "ServiceExecutionRole": "string" }

요청 파라미터

요청은 JSON 형식으로 다음 데이터를 받습니다.

InputProcessingConfiguration

레코드의 스키마를 검색하기 전에 레코드를 사전 처리하는 데 사용할 InputProcessingConfiguration입니다.

유형: InputProcessingConfiguration객체

필수 항목 여부: 아니요

InputStartingPositionConfiguration

Kinesis Data Analytics가 검색 목적으로 지정된 스트리밍 소스의 레코드 읽기를 시작하려는 시점입니다.

유형: InputStartingPositionConfiguration객체

필수 항목 여부: 아니요

ResourceARN

스트리밍 소스의 Amazon 리소스 이름(ARN)입니다.

유형: 문자열

길이 제약: 최소 길이는 1. 최대 길이는 2,048.

패턴: arn:.*

Required: No

S3Configuration

Amazon S3 객체의 데이터에서 스키마를 검색하려면 이 파라미터를 지정합니다.

유형: S3Configuration객체

필수 항목 여부: 아니요

ServiceExecutionRole

스트리밍 소스에 액세스하는 데 사용되는 역할의 ARN입니다.

유형: 문자열

길이 제약: 최소 길이는 1. 최대 길이는 2,048.

패턴: arn:.*

필수 항목 여부: 예

응답 구문

{ "InputSchema": { "RecordColumns": [ { "Mapping": "string", "Name": "string", "SqlType": "string" } ], "RecordEncoding": "string", "RecordFormat": { "MappingParameters": { "CSVMappingParameters": { "RecordColumnDelimiter": "string", "RecordRowDelimiter": "string" }, "JSONMappingParameters": { "RecordRowPath": "string" } }, "RecordFormatType": "string" } }, "ParsedInputRecords": [ [ "string" ] ], "ProcessedInputRecords": [ "string" ], "RawInputRecords": [ "string" ] }

응답 요소

작업이 성공하면 서비스가 HTTP 200 응답을 반송합니다.

다음 데이터는 서비스에 의해 JSON 형식으로 반환됩니다.

InputSchema

스트리밍 소스에서 추론된 스키마입니다. 스트리밍 소스의 데이터 형식과 각 데이터 요소가 생성할 수 있는 인애플리케이션 스트림의 해당 열에 매핑되는 방식을 식별합니다.

유형: SourceSchema객체

ParsedInputRecords

각 요소가 스트림 레코드의 행에 해당하는 요소 배열 (스트림 레코드는 행을 두 개 이상 포함할 수 있음).

유형: 문자열 배열의 배열

ProcessedInputRecords

InputProcessingConfiguration 파라미터에 지정한 프로세서에 의해 수정된 스트림 데이터입니다.

유형: 문자열 어레이

RawInputRecords

스키마를 추론하기 위해 샘플링된 원시 스트림 데이터입니다.

유형: 문자열 어레이

Errors

InvalidArgumentException

지정한 입력 파라미터 값이 유효하지 않습니다.

HTTP 상태 코드: 400

InvalidRequestException

요청 JSON이 작업에 유효하지 않습니다.

HTTP 상태 코드: 400

ResourceProvisionedThroughputExceededException

Kinesis Streams ProvisionedThroughputExceededException으로 인해 Discovery가 스트리밍 소스에서 레코드를 가져오지 못했습니다. 자세한 내용은 Amazon Kinesis Streams API 레퍼런스를 참조하십시오 GetRecords.

HTTP 상태 코드: 400

ServiceUnavailableException

서비스에서 요청을 완료할 수 없습니다.

HTTP 상태 코드: 500

UnableToDetectSchemaException

데이터 형식이 유효하지 않습니다. Kinesis Data Analytics에서는 지정된 스트리밍 소스의 스키마를 탐지할 수 없습니다.

HTTP 상태 코드: 400

UnsupportedOperationException

지정된 파라미터가 지원되지 않거나 지정된 리소스가 이 작업에 유효하지 않아 요청이 거부되었습니다.

HTTP 상태 코드: 400

참고

언어별 AWS SDK 중 하나에서 이 API를 사용하는 방법에 대한 자세한 내용은 다음을 참조하십시오.