Eine Amazon S3 Datenquelle erstellen - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Eine Amazon S3 Datenquelle erstellen

Die folgenden Beispiele veranschaulichen das Erstellen einer Amazon S3 Datenquelle. In den Beispielen wird davon ausgegangen, dass Sie bereits einen Index und eine IAM Rolle mit der Berechtigung zum Lesen der Daten aus dem Index erstellt haben. Weitere Informationen zu der IAM Rolle finden Sie unter IAM Zugriffsrollen. Weitere Informationen zum Erstellen eines Indexes finden Sie unter Index erstellen.

CLI
aws kendra create-data-source \ --index-id index ID \ --name example-data-source \ --type S3 \ --configuration '{"S3Configuration":{"BucketName":"bucket name"}}' --role-arn 'arn:aws:iam::account id:role:/role name
Python

Der folgende Python-Codeausschnitt erstellt eine Amazon S3 Datenquelle. Das vollständige Beispiel finden Sie unter. Erste Schritte (AWS SDK for Python (Boto3))

print("Create an Amazon S3 data source.") # Provide a name for the data source name = "getting-started-data-source" # Provide an optional description for the data source description = "Getting started data source." # Provide the IAM role ARN required for data sources role_arn = "arn:aws:iam::${accountID}:role/${roleName}" # Provide the data soource connection information s3_bucket_name = "S3-bucket-name" type = "S3" # Configure the data source configuration = {"S3DataSourceConfiguration": { "BucketName": s3_bucket_name } } data_source_response = kendra.create_data_source( Configuration = configuration, Name = name, Description = description, RoleArn = role_arn, Type = type, IndexId = index_id )

Das Erstellen Ihrer Datenquelle kann einige Zeit in Anspruch nehmen. Sie können den Fortschritt mithilfe der DescribeDataSourceAPI überwachen. Wenn der Status der Datenquelle lautet, ist ACTIVE die Datenquelle einsatzbereit.

Die folgenden Beispiele zeigen, wie der Status einer Datenquelle abgerufen werden kann.

CLI
aws kendra describe-data-source \ --index-id index ID \ --id data source ID
Python

Der folgende Python-Codeausschnitt enthält Informationen über eine S3-Datenquelle. Das vollständige Beispiel finden Sie unter. Erste Schritte (AWS SDK for Python (Boto3))

print("Wait for Amazon Kendra to create the data source.") while True: data_source_description = kendra.describe_data_source( Id = "data-source-id", IndexId = "index-id" ) status = data_source_description["Status"] print(" Creating data source. Status: "+status) time.sleep(60) if status != "CREATING": break

Diese Datenquelle hat keinen Zeitplan und wird daher nicht automatisch ausgeführt. Um die Datenquelle zu indizieren, rufen Sie auf, StartDataSourceSyncJobum den Index mit der Datenquelle zu synchronisieren.

Die folgenden Beispiele veranschaulichen die Synchronisation einer Datenquelle.

CLI
aws kendra start-data-source-sync-job \ --index-id index ID \ --id data source ID
Python

Der folgende Python-Codeausschnitt synchronisiert eine Amazon S3 Datenquelle. Das vollständige Beispiel finden Sie unter. Erste Schritte (AWS SDK for Python (Boto3))

print("Synchronize the data source.") sync_response = kendra.start_data_source_sync_job( Id = "data-source-id", IndexId = "index-id" )