要避免的標記實務 - AWS 方案指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

要避免的標記實務

雖然在標記物件或基礎設施時要實作實務 AWS,但也有一些實務要避免。

不一致的標記

目標章節所述,如果不加上標記,您就無法實現高度的自動化、清理或監控。同樣地,在標籤不完整或不一致的情況下,自動化或監控所需的資訊尚未完成,導致結果不可靠。

想像一個您使用標記策略來計算所有專案總成本的案例。策略從proof-of-concept(PoC) 開始,並在生產階段結束。請考慮下列案例,其中標籤會套用至專案銷售預測 P1, D1 和 Pr1 範例的資料和資源,以及專案銷售後維護 P2, D2 和 Pr2 範例。

銷售預測

範例 P1:PoC 專案 (缺少網域和時間戳記)。

env: "poc" project: "sales forecasting"

範例 D1:開發階段 (網域遺失)。

env: "dev" project: "sales forecasting" timestamp: 20210505T12:34:55

範例 Pr1:生產階段 (所有值都存在)。

env: "prod" project: "sales forecasting" domain: "machine learning" timestamp: 20210505T12:34:55

對於專案銷售預測:

  • 範例 P1 未提及物件的來源網域或時間戳記。

  • 範例 D1 也未提及專案的網域。

  • 範例 Pr1 具有所有必要的資料。

範例 P1 和 D1 會因為未定義網域而導致規劃的報告或預估不正確。

售後維護

範例 P2:PoC 專案 (缺少所有標籤)。

範例 D2:開發階段 (專案遺失)。

env: "dev" domain: "machine learning" timestamp: 20210505T12:34:55

範例 Pr2:生產階段 (所有值都存在)。

env: "prod" project: "post sales maintenance" domain: "machine learning" timestamp: 20210505T12:34:55

對於專案售後維護:

  • 範例 P2 沒有任何資訊,因此無法追蹤。

  • 範例 D2 未提及專案名稱,因此無法追蹤。

  • 範例 Pr2 具有所有必要的資料。

範例 P2 和 D2 會導致不正確的報告、計畫不足或報告不足,因為標籤遺失或不一致。

因此,持續實作標記策略非常重要。

標籤中的不正確和敏感資料

如果與不正確或敏感或私有資訊搭配使用,標記可能會具有反效果。不正確的標籤可能產生誤導性結果。使用包含敏感資料的標籤,例如個人身分識別資訊 (PII),可能會危及客戶和員工的安全。

標籤中的資訊不正確

想像一個您使用標記策略來計算每個網域或部門總成本的案例。您剛完成資料擷取階段,並開始朝機器學習邁進。下列範例包含從專案上一個階段複製的自訂標籤。

env: "development" project: "sales prediction" domain: "data ingestion" timestamp: 20210505T12:34:55

網域標示為data ingestion與上一個專案階段不正確,而不是正確的網域,也就是 machine learning。現在,data ingestion網域的報告會顯示較高的成本、時間範圍和資源配置。machine learning 網域會顯示這些報告的較低值。這會導致不正確的規劃、預算分配和截止日期估計。

擁有正確的標籤對功能系統至關重要。

標籤中的敏感資訊

AWS 提供數種工具來識別物件中的 PII。這些工具包括 Amazon MacieAWS Glue 敏感資料偵測,以尋找可用於識別個人的資料。不過,在標籤中不要使用 PII 或敏感資料,這很重要。

請考慮以下 Amazon S3 中具有已修訂或匿名 PII 的檔案範例。

{ firstName: "67A1790DCA55B8803AD024EE28F616A2", lastName: "DRG54654DFHJGDYYRD", age: 21, city : "Frankfurt", probability_of_purchase: 48.858093, veggieName: "broccoli", creditcard: false }

您可以看到客戶的名字和姓氏已雜湊。不過,在此範例中,記錄具有下列自訂標籤。

owner: "Company XYZ" about: "John Doe" contact: "johnthegreat@email.com" timestamp: 20210505T12:34:55

在這種情況下,雖然檔案本身不包含 PII,但標籤確實包含敏感資訊。這會增加資訊洩漏的機率,因為當您共用或傳輸檔案或物件時,也會共用或傳輸其中繼資料。這也適用於其他 AWS 資源,例如資料庫、資料表、任務和函數。

因此,避免在標籤中使用私有資訊非常重要。相同的概念延伸至關鍵或非公開資訊。