能力 4. 為生成式 AI 模型自訂提供安全的存取、使用和實作 - AWS 規定指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

能力 4. 為生成式 AI 模型自訂提供安全的存取、使用和實作

下圖說明針對此功能的生成 AI 帳戶建議使用的 AWS 服務。 此案例的範圍是保護模型自訂的安全。此使用案例著重於保護模型自訂工作的資源和訓練環境,以及保護自訂模型的叫用安全。

建議用於生成 AI 帳戶的 AWS 服務,以進行模型自訂。

生成人工智慧帳戶包含自訂模型所需的服務,以及實作安全防護和集中式安全控管所需的一套必要安全服務。您應該為 Amazon S3 中的訓練資料和評估儲存貯體建立 Amazon S3 閘道端點,讓私有 VPC 環境設定為存取以允許私有模型自訂。 

理由

模型自訂是為模型提供訓練資料以改善其特定使用案例效能的程序。 在 Amazon Bdrock 中,您可以自訂 Amazon 基礎模型 (FMs),以改善效能並透過使用未標籤資料繼續預先訓練以增強網域知識的方法,以及使用標籤資料進行微調以優化任務特定效能,以建立更好的客戶體驗。如果您自訂模型,則必須購買佈建輸送量才能使用它。 

此使用案例是指生成 AI 安全範圍矩陣的範圍 4。 在範圍 4 中,您可以使用數據自定義 FM,例如 Amazon 基岩中提供的 FM,以提高模型在特定任務或域上的性能。在此範圍內,您可以控制應用程式、應用程式使用的任何客戶資料、訓練資料和自訂模型,而 FM 提供者則控制預先訓練的模型及其訓練資料。 

或者,您可以使用自訂模型匯入功能匯入您在其他環境 (例如 Amazon) 中自訂的 FM,在 Amazon 基岩中建立自訂模型。 SageMaker對於匯入來源,我們強烈建議對匯入的模型序列化格式使用 Safetensors。 與 Pickle 不同,安全量程序允許您僅存儲張量數據,而不是任意的 Python 對象。這消除了導致不受信任資料未經篩選的弱點。安全源無法運行代碼-它只能安全地存儲和加載張量。

當您讓使用者在 Amazon Bdrock 中存取生成 AI 模型自訂時,您應該解決以下關鍵安全考量: 

  • 安全存取模型叫用、訓練工作,以及訓練與驗證檔案

  • 加密訓練模型工作、自訂模型以及訓練與驗證檔案

  • 警示潛在安全風險,例如越獄提示或訓練檔案中的敏感資訊 

下列各節將討論這些安全性考量與衍生式 AI 功能。 

Amazon 基岩模型定制

您可以在 Amazon Bedrock 中使用自己的資料私密且安全地自訂基礎模型 (FM),以建置專屬於您網域、組織和使用案例的應用程式。 通過微調,您可以通過提供自己的任務特定的標記培訓數據集來提高模型準確性,並進一步專門化您的 FMs。透過持續的預先訓練,您可以透過客戶管理的金鑰,在安全且受管理的環境中使用自己的未標籤資料來訓練模型。如需詳細資訊,請參閱 Amazon 基岩文件中的自訂模型

安全考量

生成式 AI 模型自訂工作負載面臨獨特的風險,包括訓練資料的資料外洩、透過將惡意提示或惡意軟體注入訓練資料中毒的資料中毒,以及在模型推論期間由威脅參與者迅速注入或資料洩漏。在 Amazon Bdrock 中,模型自訂提供強大的安全控制,包括資料保護、存取控制、網路安全、記錄和監控,以及輸入/輸出驗證,有助於降低這些風險。 

補救

資料保護

在您建立、擁有和管理的 AWS KMS 中使用客戶受管金鑰,加密模型自訂任務中的模型自訂任務、輸出檔案 (培訓和驗證指標),以及產生的自訂模型。 當您使用 Amazon 基岩執行模型自訂任務時,您會將輸入 (訓練和驗證資料) 檔案存放在 S3 儲存貯體中。任務完成後,Amazon Bdrock 會將輸出指標檔案存放在您建立任務時指定的 S3 儲存貯體中,並將產生的自訂模型成品存放在由 AWS 控制的 S3 儲存貯體中。 根據預設,輸入和輸出檔案會使用 AWS 受管金鑰使用 Amazon S3 SSE-S3 伺服器端加密進行加密。 您也可以選擇使用客戶管理的金鑰來加密這些檔案。

身分與存取管理

遵循最低權限原則,為模型自訂或模型匯入建立自訂服務角色。對於模型自訂服務角色,請建立信任關係,讓 Amazon Bedrock 擔任此角色並執行模型自訂任務。 附加政策以允許該角色存取您的訓練和驗證資料,以及您要寫入輸出資料的儲存貯體。 對於模型匯入服務角色,請建立信任關係,讓 Amazon Bedrock 擔任此角色並執行模型匯入任務。 附加政策以允許角色存取 S3 儲存貯體中的自訂模型檔案。如果您的模型自訂工作在 VPC 中執行,請將 VPC 權限附加至模型自訂角色。 

網絡安全

若要控制對資料的存取,請搭配 Amazon VPC 使用虛擬私有雲端 (VPC)。 建立 VPC 時,建議您使用端點路由表的預設 DNS 設定,以便標準 Amazon S3 URL 進行解析。 

如果您在沒有網際網路存取的情況下設定 VPC,則需要建立 Amazon S3 VPC 端點,以允許模型自訂任務存取用於存放訓練和驗證資料的 S3 儲存貯體,並存放模型成品。

完成 VPC 和端點的設定後,您需要將許可附加到模型自訂 IAM 角色。 設定 VPC 以及所需的角色和權限後,您可以建立使用此 VPC 的模型自訂工作。透過針對訓練資料建立無法存取網際網路的 VPC,並使用相關聯的 S3 VPC 端點,您可以使用私有連線執行模型自訂任務 (沒有任何網際網路暴露)。 

建議的 AWS 服務

Amazon Simple Storage Service (Amazon S3)

當您執行模型自訂任務時,任務會存取 S3 儲存貯體以下載輸入資料並上傳任務指標。在 Amazon 基岩主控台或 API 上提交模型自訂任務時,您可以選擇微調或繼續預先訓練作為模型類型。 模型自訂任務完成後,您可以檢視您提交工作時指定的輸出 S3 儲存貯體中的檔案,或檢視模型的詳細資訊,來分析訓練程序的結果。使用客戶管理的金鑰來加密這兩個值區。若要進一步強化網路安全性,您可以為 VPC 環境設定要存取的 S3 儲存貯體建立閘道端點。 訪問應記錄和監控。使用版本控制進行備份。您可以使用以資源為基礎的政策來更嚴格地控制對 Amazon S3 檔案的存取。 

Amazon Macie

Macie 可協助識別 Amazon S3 訓練和驗證資料集中的敏感資料。 如需安全性最佳做法,請參閱本指南中先前的 Macie 章節

Amazon EventBridge

您可以使用 Amazon 設 EventBridge定 Amazon, SageMaker 以自動回應 Amazon 基岩中的模型自訂任務狀態變更。來自 Amazon 基岩的活動以近乎即時的方 EventBridge 式傳送到 Amazon。您可以撰寫簡單的規則,在事件符合規則時自動執行動作。

AWS KMS

我們建議您使用客戶受管金鑰來加密模型自訂任務、模型自訂任務的輸出檔案 (訓練和驗證指標)、產生的自訂模型,以及託管訓練、驗證和輸出資料的 S3 儲存貯體。如需詳細資訊,請參閱 Amazon 基岩文件中的模型自訂任務和成品的加密

鑰政策是 AWS KMS 金鑰的資源政策。金鑰政策是控制對 KMS 金鑰之存取的主要方式。您也可以使用 IAM 政策和授權來控制 KMS 金鑰的存取權,但是每個 KMS 金鑰都必須有金鑰政策。使用金鑰原則提供角色權限,以存取使用客戶管理金鑰加密的自訂模型。這可讓指定的角色使用自訂模型進行推論。

使用 Amazon CloudWatch、Amazon CloudTrail、Amazon OpenSearch 無伺服器、Amazon S3 和 Amazon Comprehend,如先前功能部分所述。