Memulai (SDKuntuk Python (Boto3)) - Amazon Personalize

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memulai (SDKuntuk Python (Boto3))

Tutorial ini menunjukkan cara menyelesaikan alur kerja Amazon Personalize dari awal hingga akhir dengan for SDK Python (Boto3).

Saat Anda menyelesaikan latihan memulai, untuk menghindari biaya yang tidak perlu, hapus sumber daya yang Anda buat. Untuk informasi selengkapnya, lihat Persyaratan untuk menghapus sumber daya Amazon Personalize.

Prasyarat

Berikut ini adalah langkah-langkah prasyarat untuk menggunakan contoh Python dalam panduan ini:

  • Selesaikan Memulai prasyarat untuk mengatur izin yang diperlukan dan membuat data pelatihan. Jika Anda menggunakan data sumber Anda sendiri, pastikan bahwa data Anda diformat seperti prasyarat.

  • Siapkan AWS SDK for Python (Boto3) lingkungan Anda seperti yang ditentukan dalamMenyiapkan AWS SDKs.

Tutorial

Dalam langkah-langkah berikut, Anda memverifikasi lingkungan Anda dan membuat klien Python (Boto3) SDK untuk Amazon Personalisasi. Kemudian Anda mengimpor data, membuat dan menerapkan versi solusi dengan kampanye, dan mendapatkan rekomendasi.

Setelah Anda menyelesaikan prasyarat, jalankan contoh Python berikut untuk mengonfirmasi bahwa lingkungan Anda dikonfigurasi dengan benar. Kode ini juga membuat klien Amazon Personalize boto3 yang Anda gunakan dalam tutorial ini. Jika lingkungan Anda dikonfigurasi dengan benar, daftar resep yang tersedia ditampilkan, dan Anda dapat menjalankan contoh lain dalam tutorial ini.

import boto3 personalizeRt = boto3.client('personalize-runtime') personalize = boto3.client('personalize') response = personalize.list_recipes() for recipe in response['recipes']: print (recipe)

Setelah Anda membuat Amazon Personalisasi klien boto3 dan memverifikasi lingkungan Anda, impor data historis yang Anda buat saat Anda menyelesaikan. Memulai prasyarat Untuk mengimpor data historis ke Amazon Personalize, lakukan hal berikut:

  1. Gunakan kode berikut untuk membuat skema di Amazon Personalize. Ganti getting-started-schema dengan nama untuk skema.

    import json schema = { "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" } create_interactions_schema_response = personalize.create_schema( name='getting-started-schema', schema=json.dumps(schema) ) interactions_schema_arn = create_interactions_schema_response['schemaArn'] print(json.dumps(create_interactions_schema_response, indent=2))
  2. Buat grup kumpulan data dengan kode berikut. Ganti dataset group name dengan nama untuk grup dataset.

    response = personalize.create_dataset_group(name = 'dataset group name') dataset_group_arn = response['datasetGroupArn'] description = personalize.describe_dataset_group(datasetGroupArn = dataset_group_arn)['datasetGroup'] print('Name: ' + description['name']) print('ARN: ' + description['datasetGroupArn']) print('Status: ' + description['status'])
  3. Buat kumpulan data interaksi Item di grup kumpulan data baru Anda dengan kode berikut. Beri nama kumpulan data dan berikan schema_arn dan dataset_group_arn dari langkah sebelumnya.

    response = personalize.create_dataset( name = 'datase_name', schemaArn = 'schema_arn', datasetGroupArn = 'dataset_group_arn', datasetType = 'Interactions' ) dataset_arn = response['datasetArn']
  4. Impor data Anda dengan pekerjaan impor dataset dengan kode berikut. Kode menggunakan metode describe_dataset_import_job untuk melacak status pekerjaan.

    Teruskan parameter berikut sebagai parameter: nama untuk pekerjaan, dataset_arn dari langkah sebelumnya, jalur bucket Amazon S3 (s3://bucket name/folder name/ratings.csv) tempat Anda menyimpan data pelatihan, dan peran IAM layanan Anda. ARN Anda menciptakan peran ini sebagai bagian dariMemulai prasyarat. Amazon Personalize memerlukan izin untuk mengakses bucket. Lihat Memberikan Amazon Personalisasi akses ke sumber daya Amazon S3.

    import time response = personalize.create_dataset_import_job( jobName = 'JobName', datasetArn = 'dataset_arn', dataSource = {'dataLocation':'s3://amzn-s3-demo-bucket/filename.csv'}, roleArn = 'role_arn', importMode = 'FULL' ) dataset_interactions_import_job_arn = response['datasetImportJobArn'] description = personalize.describe_dataset_import_job( datasetImportJobArn = dataset_interactions_import_job_arn)['datasetImportJob'] print('Name: ' + description['jobName']) print('ARN: ' + description['datasetImportJobArn']) print('Status: ' + description['status']) max_time = time.time() + 3*60*60 # 3 hours while time.time() < max_time: describe_dataset_import_job_response = personalize.describe_dataset_import_job( datasetImportJobArn = dataset_interactions_import_job_arn ) status = describe_dataset_import_job_response["datasetImportJob"]['status'] print("Interactions DatasetImportJob: {}".format(status)) if status == "ACTIVE" or status == "CREATE FAILED": break time.sleep(60)

Setelah mengimpor data, Anda membuat solusi dan versi solusi sebagai berikut. Solusinya berisi konfigurasi untuk melatih model dan versi solusi adalah model terlatih.

  1. Buat solusi baru dengan kode berikut. Lulus yang berikut ini sebagai parameter: dataset_group_arn dari sebelumnya, nama untuk solusi, dan untuk resep User-personalization-v2 (). ARN arn:aws:personalize:::recipe/aws-user-personalization-v2 Simpan solusi baru Anda untuk digunakan nanti. ARN

    create_solution_response = personalize.create_solution( name='solution name', recipeArn= 'arn:aws:personalize:::recipe/aws-user-personalization-v2', datasetGroupArn = 'dataset group arn' ) solution_arn = create_solution_response['solutionArn'] print('solution_arn: ', solution_arn)
  2. Buat versi solusi dengan kode berikut. Lulus sebagai parameter solution_arn dari langkah sebelumnya. Kode berikut membuat versi solusi. Selama pelatihan, kode menggunakan DescribeSolutionVersion operasi untuk mengambil status versi solusi. Ketika pelatihan selesai, metode mengembalikan ARN versi solusi baru Anda. Simpan untuk digunakan nanti.

    import time import json create_solution_version_response = personalize.create_solution_version( solutionArn = solution_arn ) solution_version_arn = create_solution_version_response['solutionVersionArn'] print(json.dumps(create_solution_version_response, indent=2)) max_time = time.time() + 3*60*60 # 3 hours while time.time() < max_time: describe_solution_version_response = personalize.describe_solution_version( solutionVersionArn = solution_version_arn ) status = describe_solution_version_response["solutionVersion"]["status"] print("SolutionVersion: {}".format(status)) if status == "ACTIVE" or status == "CREATE FAILED": break time.sleep(60)

Setelah Anda membuat versi solusi, terapkan dengan kampanye Amazon Personalize. Gunakan kode berikut untuk membuat kampanye yang menerapkan versi solusi Anda. Lulus yang berikut ini sebagai parameter:solution_version_arn, dan nama untuk kampanye. Metode ini mengembalikan Amazon Resource Name (ARN) kampanye baru Anda. Simpan untuk digunakan nanti.

response = personalize.create_campaign( name = 'campaign name', solutionVersionArn = 'solution version arn' ) arn = response['campaignArn'] description = personalize.describe_campaign(campaignArn = arn)['campaign'] print('Name: ' + description['name']) print('ARN: ' + description['campaignArn']) print('Status: ' + description['status'])

Setelah Anda membuat kampanye, Anda dapat menggunakannya untuk mendapatkan rekomendasi. Kode berikut menunjukkan cara mendapatkan rekomendasi dari kampanye dan mencetak ID setiap item yang direkomendasikan. Lulus kampanye yang Anda buat di langkah sebelumnya. ARN Untuk ID pengguna, Anda meneruskan ID pengguna yang dari data pelatihan, seperti123.

response = personalizeRt.get_recommendations( campaignArn = 'Campaign ARN', userId = '123', numResults = 10 ) print("Recommended items") for item in response['itemList']: print (item['itemId'])

Memulai menggunakan Amazon Personalize APIs dengan notebook Jupyter () iPython

Untuk mulai menggunakan Amazon Personalize menggunakan notebook Jupyter, kloning atau unduh serangkaian notebook yang ditemukan di folder getting_started dari repositori Amazon Personalize samples. Notebook memandu Anda mengimpor data pelatihan, membuat solusi, membuat kampanye, dan mendapatkan rekomendasi menggunakan Amazon Personalize.