Creación de una fuente Amazon S3 de datos - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Creación de una fuente Amazon S3 de datos

Los siguientes ejemplos muestran la creación de una fuente de Amazon S3 datos. En los ejemplos se supone que ya ha creado un índice y un IAM rol con permiso para leer los datos del índice. Para obtener más información sobre el IAM rol, consulte roles de IAM acceso. Para obtener más información acerca de cómo crear un índice, consulte Creación de un índice.

CLI
aws kendra create-data-source \ --index-id index ID \ --name example-data-source \ --type S3 \ --configuration '{"S3Configuration":{"BucketName":"bucket name"}}' --role-arn 'arn:aws:iam::account id:role:/role name
Python

El siguiente fragmento de código Python crea una fuente de Amazon S3 datos. Para ver el ejemplo completo, consulte Introducción (AWS SDK for Python (Boto3)).

print("Create an Amazon S3 data source.") # Provide a name for the data source name = "getting-started-data-source" # Provide an optional description for the data source description = "Getting started data source." # Provide the IAM role ARN required for data sources role_arn = "arn:aws:iam::${accountID}:role/${roleName}" # Provide the data soource connection information s3_bucket_name = "S3-bucket-name" type = "S3" # Configure the data source configuration = {"S3DataSourceConfiguration": { "BucketName": s3_bucket_name } } data_source_response = kendra.create_data_source( Configuration = configuration, Name = name, Description = description, RoleArn = role_arn, Type = type, IndexId = index_id )

La creación del origen de datos puede tardar algún tiempo. Puede supervisar el progreso mediante la DescribeDataSourceAPI. Cuando el estado del origen de datos es ACTIVE, está listo para usarse.

Los siguientes ejemplos muestran cómo obtener el estado de un origen de datos.

CLI
aws kendra describe-data-source \ --index-id index ID \ --id data source ID
Python

El siguiente fragmento de código Python obtiene información sobre un origen de datos de S3. Para ver el ejemplo completo, consulte Introducción (AWS SDK for Python (Boto3)).

print("Wait for Amazon Kendra to create the data source.") while True: data_source_description = kendra.describe_data_source( Id = "data-source-id", IndexId = "index-id" ) status = data_source_description["Status"] print(" Creating data source. Status: "+status) time.sleep(60) if status != "CREATING": break

Este origen de datos no tiene una programación, por lo que no se ejecuta automáticamente. Para indexar la fuente de datos, llame StartDataSourceSyncJobpara sincronizar el índice con la fuente de datos.

Los siguientes ejemplos muestran la sincronización de un origen de datos.

CLI
aws kendra start-data-source-sync-job \ --index-id index ID \ --id data source ID
Python

El siguiente fragmento de código Python sincroniza un origen de datos de Amazon S3 . Para ver el ejemplo completo, consulte Introducción (AWS SDK for Python (Boto3)).

print("Synchronize the data source.") sync_response = kendra.start_data_source_sync_job( Id = "data-source-id", IndexId = "index-id" )