機器學習身分解析的運作方式 - Amazon Connect

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

機器學習身分解析的運作方式

本主題說明身分解析如何執行自動設定檔比對,以及如果被設定,會如何自動合併類似的設定檔。

自動設定檔比對

為了識別類似的設定檔,身分解析會使用機器學習來檢閱每個設定檔中的下列個人身分識別資訊 (PII) 屬性:

  • 名稱:所有名稱都會進行相似性審核,包括名字,中間名和姓氏。

  • 電子郵件:所有電子郵件地址都經過審核,以確保相似性,包括個人電子郵件和商務電子郵件。不區分大小寫。

  • 電話號碼:所有電話號碼和格式都經過審查,以確保相似性,包括家庭電話,手機和商務電話。

  • 地址:審查所有地址類型和格式的相似性,包括公司地址,郵寄地址,送貨地址和帳單地址。

  • 出生日期:審查所有出生日期和格式的相似性。

它會使用此資訊來建立類似設定檔的相符群組。

匹配群組

相符群組由代表同一客戶的所有類似設定檔組成。每個匹配群組都包含以下資訊:

  • 相符 ID,可唯一識別代表同一聯絡人的兩個或多個類似設定檔的群組

  • 相符群組中的設定檔 ID 數

  • 與相符群組關聯的可信度分數

可信度分數

自動比對程序執行後,您可以查詢 S3 儲存貯體或使用 GetMatchesAPI 根據可信度分數篩選結果。例如,您可以篩選出高可信度匹配項目,以供進一步檢閱。

可信度分數是介於 0 到 1 之間的數字,代表將設定檔指派給相符群組的信賴等級。分數為 1 可能表示完全相符。

自動合併類似的設定檔

比對設定檔後,身分解析任務可以根據您的條件選擇性地合併類似的設定檔。如果您刪除或更新條件,更新的條件會在下一次執行中套用至類似的設定檔。

重要

您無法復原合併程序。我們強烈建議您先使用 GetAutoMergingPreviewAPI 來執行自動合併程序,再執行身分識別解析 Job。

注意

合併兩個描述檔時,透過 API 呼叫手動填入的描述檔欄位或 Agent Workspace 將不會被自動從整合或自訂物件類型對應擷取的設定檔欄位覆寫。

例如,假設設定檔是由代理程式工作區中的代理程式以 FirstName 「John」手動建立的。另一個配置文件是使用與 FirstName 「Peter」的 S3 集成創建的。如果這些設定檔自動合併,則會保留 FirstName 「John」。

自動合併程序的運作方式

  • 合併條件中的所有選擇屬性在合併之前,都會使用具有精確值比較的 AND 條件連結

    • 例如,如果在條件中指定了多個屬性,例如 email addressphone number,則相符群組中具有完全相同的 email addressphone number 值的所有類似設定檔都會被合併。

    • 如果相符群組中的一或多個類似設定檔在條件中的一或多個屬性具有不同的值或缺少值,則會合併類似的設定檔。

      例如,一個相符群組可能是五個相似的設定檔,其中三個設定檔已合併,因為這三個設定檔符合條件。其他兩個設定檔則不會合併,因為它們不符合條件。

  • 多個條件會以從條件 1 開始的優先順序評估

    • 套用合併條件的順序。它從最高優先級的條件 1 開始,直到最低優先級的條件 10。

    • 身分解析任務套用一個條件後,下一個條件會套用至合併的設定檔,以及相符群組中其餘的類似設定檔。

    • 您最多可以有 10 個合併條件。

  • 每個條件都會獨立執行,並以 OR 的形式與其他條件一同運作

    • 如果您有多個條件,則「身分解析任務」移至下一個條件之前,會個別套用每個條件,並依據優先順序順序套用。

    • 所有條件都會依照您列出的順序套用。合併相符群組中的類似設定檔時,條件是否失敗或成功並不重要。

  • 依據預設,設定檔衝突由時近來管理

    • 當相符群組中的兩個或多個類似設定檔符合合併條件時,會透過比較構成類似設定檔屬性的每個 值來建立所產生的合併設定檔。

    • 每個屬性的值都可能完全相符。在這種情況下,可以為該屬性選擇任何值。

    • 如果兩個或多個構成相似設定檔的值之間存在衝突,則會選擇最近更新的屬性。

      例如,如果 Jane Doe 在組成類似設定檔的 Address 屬性中有三個不同的值,則身分解析會挑選最近處理的值來建立統一設定檔。

    • 依據預設,上 上次更新的時間戳記 會用來決定最近更新的記錄。

  • 設定檔衝突由來源物件類型和時近來管理

    • 您也可以改變衝突解決的預設行為,從特定來源選擇類似的構成設定檔作為事實來源,以通知衝突解決方案。

    • 如果您要指定用於設定檔衝突的資料來源,若選擇 具有上次更新時間戳記的來源,則可以選擇其中一個物件類型作為資料來源。

    • 指定物件類型中最近更新的記錄可用於解決設定檔衝突。

  • 上次更新的時間戳記可識別最近更新的記錄

    • 與源記錄的對象類型關聯的 timestamp 屬性用於識別哪個記錄最近被更新。

    • 如果該物件類型無法使用 timestamp 屬性,則會使用該記錄擷取至客戶設定檔網域的時間戳記。

    • 如果您有自訂物件類型,則需要新增時間戳記。如需詳細資訊,請參閱設定檔衝突缺少時間戳記

  • 合併是單向程序,無法復原

如需顯示如何套用條件的範例,請參閱 範例:如何套用範例條件