기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon S3 데이터 소스 생성
다음 예제에서는 Amazon S3 데이터 소스 생성을 보여줍니다. 이 예제에서는 인덱스에서 데이터를 읽을 수 있는 권한이 있는 인덱스와 IAM 역할을 이미 생성했다고 가정합니다. IAM 역할에 대한 자세한 내용은 IAM 액세스 역할을 참조하세요. 인덱스 생성에 대한 자세한 내용은 인덱스 생성을 참조하세요.
- CLI
-
aws kendra create-data-source \
--index-id index ID
\
--name example-data-source \
--type S3 \
--configuration '{"S3Configuration":{"BucketName":"bucket name
"}}'
--role-arn 'arn:aws:iam::account id
:role:/role name
- Python
-
다음 Python 코드 조각은 Amazon S3 데이터 소스를 생성합니다. 전체 예제는 시작하기(AWS SDK for Python (Boto3)) 섹션을 참조하세요.
print("Create an Amazon S3 data source.")
name = "getting-started-data-source"
description = "Getting started data source."
role_arn = "arn:aws:iam::${accountID}:role/${roleName}"
s3_bucket_name = "S3-bucket-name"
type = "S3"
configuration = {"S3DataSourceConfiguration":
{
"BucketName": s3_bucket_name
}
}
data_source_response = kendra.create_data_source(
Configuration = configuration,
Name = name,
Description = description,
RoleArn = role_arn,
Type = type,
IndexId = index_id
)
데이터 소스를 생성하는 데 시간이 조금 걸릴 수 있습니다. DescribeDataSource API를 사용하여 진행 상황을 모니터링할 수 있습니다. 데이터 소스 상태가 ACTIVE
가 되면 데이터 소스를 사용할 준비가 된 것입니다.
다음 예제는 데이터 소스의 상태를 가져오는 방법을 보여줍니다.
- CLI
-
aws kendra describe-data-source \
--index-id index ID
\
--id data source ID
- Python
-
다음 Python 코드 스니펫은 S3 데이터 소스에 대한 정보를 가져옵니다. 전체 예제는 시작하기(AWS SDK for Python (Boto3)) 섹션을 참조하세요.
print("Wait for Amazon Kendra to create the data source.")
while True:
data_source_description = kendra.describe_data_source(
Id = "data-source-id
",
IndexId = "index-id
"
)
status = data_source_description["Status"]
print(" Creating data source. Status: "+status)
time.sleep(60)
if status != "CREATING":
break
이 데이터 소스에는 일정이 없으므로 자동으로 실행되지 않습니다. 데이터 소스를 인덱싱하려면 StartDataSourceSyncJob을 호출하여 인덱스를 데이터 소스와 동기화합니다.
다음 예는 데이터 소스 동기화를 보여줍니다.
- CLI
-
aws kendra start-data-source-sync-job \
--index-id index ID
\
--id data source ID
- Python
-
다음 Python 코드 스니펫은 Amazon S3
데이터 소스를 동기화합니다. 전체 예제는 시작하기(AWS SDK for Python (Boto3)) 섹션을 참조하세요.
print("Synchronize the data source.")
sync_response = kendra.start_data_source_sync_job(
Id = "data-source-id
",
IndexId = "index-id
"
)