本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
設定訓練時使用的資料欄
重要
根據預設,所有新解決方案都會使用自動訓練。透過自動訓練,您會在解決方案處於作用中狀態時產生訓練成本。為了避免不必要的成本,您可以在完成後更新解決方案以關閉自動訓練。如需訓練成本的相關資訊,請參閱 Amazon Personalize 定價
如果您的配方產生項目建議或使用者區段,您可以修改 Amazon Personalize 在建立解決方案版本 (訓練模型) 時考慮的資料欄。
您可以變更訓練時使用的資料欄,以控制 Amazon Personalize 在訓練模型 (建立解決方案版本) 時使用的資料。您可以這樣做來實驗訓練資料的不同組合。或者,您可以在沒有有意義的資料的情況下排除資料欄。例如, 可能有一個資料欄,您只想用來篩選建議。您可以將此資料欄排除在訓練之外,Amazon Personalize 只會在篩選時考慮此資料欄。
您無法排除 EVENT_TYPE 資料欄。根據預設,Amazon Personalize 會使用可在訓練時使用的所有資料欄。下列資料一律排除在訓練之外:
-
具有布林值資料類型的資料欄
-
非分類或文字的自訂字串欄位
您無法在訓練中包含印模資料,但如果您的使用案例或配方使用印模資料,Amazon Personalize 會使用印模資料,在您取得建議時引導探索。
如果您已建立解決方案,且想要修改訓練時使用的資料欄,您可以複製解決方案。當您複製解決方案時,您可以使用現有解決方案的組態做為起點,例如配方和超參數,並視需要進行任何變更。如需詳細資訊,請參閱複製解決方案 (主控台)。
您可以使用 Amazon Personalize 主控台、 AWS Command Line Interface (AWS CLI) 或 AWS SDK 來設定 Amazon Personalize 使用的資料欄。如需使用 Amazon Personalize 主控台選擇資料欄的詳細資訊,請參閱 中的進階組態步驟建立解決方案 (主控台)。建立解決方案之後,您可以在 Amazon Personalize 主控台的解決方案詳細資訊頁面上檢視解決方案使用的資料欄,或使用 DescribeSolution操作。
設定訓練時使用的資料欄 (AWS CLI)
若要將資料欄排除在訓練之外,請在 中提供 excludedDatasetColumns
物件trainingDataConfig
做為解決方案組態的一部分。針對每個金鑰,提供資料集類型。針對每個值,提供要排除的資料欄清單。下列程式碼說明如何在使用 建立解決方案時,將資料欄排除在訓練之外 AWS CLI。
aws personalize create-solution \ --name
solution name
\ --dataset-group-arndataset group ARN
\ --recipe-arnrecipe ARN
\ --solution-config "{\"trainingDataConfig\": {\"excludedDatasetColumns\": { \"datasetType
\" : [ \"column1Name
\", \"column2Name
\"]}}}"
設定訓練時使用的資料欄AWS SDKs)
若要將資料欄排除在訓練之外,請在 中提供 excludedDatasetColumns
物件trainingDataConfig
做為解決方案組態的一部分。針對每個金鑰,提供資料集類型。針對每個值,提供要排除的資料欄清單。下列程式碼說明如何在使用適用於 Python 的 SDK (Boto3) 建立解決方案時,將資料欄排除在訓練之外。
import boto3
personalize = boto3.client('personalize')
create_solution_response = personalize.create_solution(
name = 'solution name
',
recipeArn = 'recipe ARN
',
datasetGroupArn = 'dataset group ARN
',
solutionConfig = {
"trainingDataConfig": {
"excludedDatasetColumns": {
"datasetType
": ["COLUMN_A
", "COLUMN_B
"]
}
}
}
)
solution_arn = create_solution_response['solutionArn']
print('solution_arn: ', solution_arn)