匯入對話文字記錄 - Amazon Lex

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

匯入對話文字記錄

匯入對話文字記錄是一個三步驟程序:

  1. 將文字記錄轉換為正確的格式,以準備要匯入的文字記錄。如果您使用適用於 Amazon Connect 的 Contact Lens,文字記錄已採用正確的格式。

  2. 將文字記錄上傳至 Amazon S3 儲存貯體。如果您使用的是 Contact Lens,您的文字記錄已經在 S3 儲存貯體中。

  3. 使用 Amazon Lex V2 主控台或API操作分析轉錄。完成訓練所需的時間取決於文字記錄的量和對話的複雜性。一般而言,每分鐘會分析 500 行文字記錄。

以下各節將說明每個步驟。

從 Contact Lens for Amazon Connect 匯入文字記錄

Amazon Lex V2 自動化聊天機器人設計工具與 Contact Lens 轉錄檔案相容。若要使用 Contact Lens 文字記錄檔案,您必須開啟 Contact Lens,並記下其輸出檔案的位置。

從 Contact Lens 匯出文字記錄
  1. 在 Amazon Connect 執行個體中開啟 Contact Lens。如需指示,請參閱 Amazon Connect 管理員指南 中的啟用 Amazon Connect 的 Contact LensAmazon Connect

  2. 請注意 Amazon Connect 用於執行個體的 S3 儲存貯體位置。若要查看位置,請在 Amazon Connect 主控台中開啟資料儲存頁面。如需指示,請參閱 Amazon Connect 管理員指南 中的更新執行個體設定

開啟 Contact Lens 並記下轉錄檔案的位置後,請前往 使用 Amazon Lex V2 主控台分析您的文字記錄 以取得匯入和分析轉錄的說明。

準備文字記錄

透過建立文字記錄檔案來準備文字記錄。

  • 每次對話建立一個文字記錄檔案,列出各方之間的互動。對話中的每個互動可以跨越多行。您可以同時提供已編輯和未編輯的對話版本。

  • 檔案必須是 中指定的JSON格式輸入文字記錄格式

  • 您必須提供至少 1,000 個對話輪換。為了改善對意圖和插槽類型的探索,您應該提供約 10,000 個或更多的對話周轉。自動化聊天機器人設計工具只會處理前 700,000 次輪換。

  • 您可以上傳的轉錄檔案數量沒有限制,也沒有檔案大小限制。

如果您計劃依日期篩選匯入的轉錄,檔案必須位於下列目錄結構中:

<path or bucket root> --> yyyy --> mm --> dd --> transcript files

文字記錄檔案必須包含檔案名稱中某處 "yyyy-mm-dd" 格式的日期。

從其他聯絡中心應用程式匯出文字記錄
  1. 使用聯絡中心應用程式的工具匯出對話。對話必須至少包含 中指定的資訊輸入文字記錄格式

  2. 將聯絡中心應用程式產生的文字記錄轉換為 中所述的格式輸入文字記錄格式。您有責任執行轉換。

我們提供三個指令碼來準備文字記錄。這些類別為:

  • 將 Contact Lens 文字記錄與 Amazon Lex V2 對話日誌結合的指令碼。Contact Lens 文字記錄不包含與 Amazon Lex V2 機器人互動的部分 Amazon Connect 對話。 Amazon Lex V2 指令碼需要為 Amazon Lex V2 開啟對話日誌,以及查詢對話日誌 CloudWatch 日誌和 Contact Lens S3 儲存貯體的適當許可。

  • 將 Amazon Transcribe 呼叫分析轉換為 Amazon Lex V2 輸入格式的指令碼。

  • 將 Amazon Connect 聊天文字記錄轉換為 Amazon Lex V2 輸入格式的指令碼。

您可以從此 GitHub 儲存庫下載指令碼: https://github.com/aws-samples/amazon-lex-bot-recommendation-integration

將文字記錄上傳至 S3 儲存貯體

如果您使用的是 Contact Lens,您的文字記錄檔案已包含在 S3 儲存貯體中。如需文字記錄檔案的位置和檔案名稱,請參閱 Amazon Connect 管理員指南 中的 Contact Lens 輸出檔案範例

如果您使用的是另一個聯絡中心應用程式,但尚未為文字記錄檔案設定 S3 儲存貯體,請遵循此程序。否則,如果您有現有的 S3 儲存貯體,則在登入 Amazon S3 主控台之後,請遵循從步驟 5 開始的此程序。

將檔案上傳至 S3 儲存貯體
  1. 登入 AWS Management Console 並在 開啟 Amazon S3 主控台https://console.aws.amazon.com/s3/

  2. 選擇建立儲存貯體

  3. 為儲存貯體命名並選擇區域。區域必須與 Amazon Lex V2 所使用的區域相同。根據您的使用案例所需設定其他選項。

  4. 選擇建立儲存貯體

  5. 從儲存貯體清單中,選擇現有的儲存貯體或您剛建立的儲存貯體

  6. 選擇上傳

  7. 新增您要上傳的轉錄檔案。

  8. 選擇上傳

使用 Amazon Lex V2 主控台分析您的文字記錄

您只能以空白語言使用自動機器人設計。您可以將新語言新增至現有機器人,或建立新的機器人。

在新機器人中建立新語言
  1. 登入 AWS Management Console 並在 開啟 Amazon Lex 主控台https://console.aws.amazon.com/lex/

  2. 選擇建立機器人

  3. 選擇從 Automated Chatbot Designer 開始。填寫資訊以建立新的機器人。

  4. 選擇下一步

  5. 將語言新增至機器人中,填寫語言的資訊。

  6. S3 上的文字記錄檔案位置區段中,視需要選擇包含文字記錄檔案的 S3 儲存貯體,以及檔案的本機路徑。

  7. 您可以選擇性地選擇下列項目:

    • 在處理期間加密轉錄資料的 AWS KMS 金鑰。如果您未選取金鑰,則會使用服務 AWS KMS 金鑰。

    • 將文字記錄篩選至特定日期範圍。如果您選擇篩選文字記錄,它們必須位於正確的資料夾結構中。如需詳細資訊,請參閱準備文字記錄

  8. 選擇完成

等待 Amazon Lex V2 處理轉錄。當分析完成時,您會看到完成訊息。

如何停止分析您的文字記錄

如果您需要停止已上傳文字記錄的分析,您可以停止執行中的BotRecommendation任務,其BotRecommendationStatus狀態為處理中。從主控台提交任務或使用 StopBotRecommendation CLISDK進行 後,您可以按一下橫幅上出現的停止處理按鈕API。如需詳細資訊,請參閱 StopBotRecommendation

呼叫 後StopBotRecommendation,內部 BotRecommendationStatus 會設定為 Stopping,而且不會向您收取費用。若要確定任務已停止,您可以呼叫 DescribeBotRecommendationAPI,並確認 BotRecommendationStatusStopped。這通常需要 3-4 分鐘。

StopBotRecommendationAPI呼叫 之後,您不需要支付處理費用。