Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Creación de una fuente Amazon S3 de datos
Los siguientes ejemplos muestran la creación de una fuente de Amazon S3 datos. En los ejemplos se supone que ya ha creado un índice y un IAM rol con permiso para leer los datos del índice. Para obtener más información sobre el IAM rol, consulte roles de IAM acceso. Para obtener más información acerca de cómo crear un índice, consulte Creación de un índice.
- CLI
-
aws kendra create-data-source \
--index-id index ID
\
--name example-data-source \
--type S3 \
--configuration '{"S3Configuration":{"BucketName":"bucket name
"}}'
--role-arn 'arn:aws:iam::account id
:role:/role name
- Python
-
El siguiente fragmento de código Python crea una fuente de Amazon S3 datos. Para ver el ejemplo completo, consulte Introducción (AWS SDK for Python (Boto3)).
print("Create an Amazon S3 data source.")
# Provide a name for the data source
name = "getting-started-data-source"
# Provide an optional description for the data source
description = "Getting started data source."
# Provide the IAM role ARN required for data sources
role_arn = "arn:aws:iam::${accountID}:role/${roleName}"
# Provide the data soource connection information
s3_bucket_name = "S3-bucket-name"
type = "S3"
# Configure the data source
configuration = {"S3DataSourceConfiguration":
{
"BucketName": s3_bucket_name
}
}
data_source_response = kendra.create_data_source(
Configuration = configuration,
Name = name,
Description = description,
RoleArn = role_arn,
Type = type,
IndexId = index_id
)
La creación del origen de datos puede tardar algún tiempo. Puede supervisar el progreso mediante la DescribeDataSourceAPI. Cuando el estado del origen de datos es ACTIVE
, está listo para usarse.
Los siguientes ejemplos muestran cómo obtener el estado de un origen de datos.
- CLI
-
aws kendra describe-data-source \
--index-id index ID
\
--id data source ID
- Python
-
El siguiente fragmento de código Python obtiene información sobre un origen de datos de S3. Para ver el ejemplo completo, consulte Introducción (AWS SDK for Python (Boto3)).
print("Wait for Amazon Kendra to create the data source.")
while True:
data_source_description = kendra.describe_data_source(
Id = "data-source-id
",
IndexId = "index-id
"
)
status = data_source_description["Status"]
print(" Creating data source. Status: "+status)
time.sleep(60)
if status != "CREATING":
break
Este origen de datos no tiene una programación, por lo que no se ejecuta automáticamente. Para indexar la fuente de datos, llame StartDataSourceSyncJobpara sincronizar el índice con la fuente de datos.
Los siguientes ejemplos muestran la sincronización de un origen de datos.
- CLI
-
aws kendra start-data-source-sync-job \
--index-id index ID
\
--id data source ID
- Python
-
El siguiente fragmento de código Python sincroniza un origen de datos de Amazon S3
. Para ver el ejemplo completo, consulte Introducción (AWS SDK for Python (Boto3)).
print("Synchronize the data source.")
sync_response = kendra.start_data_source_sync_job(
Id = "data-source-id
",
IndexId = "index-id
"
)