Amazon Sagemaker Canvas 使用入門 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Sagemaker Canvas 使用入門

本指南會說明如何開始使用 SageMaker Canvas。如果您是 IT 管理員,並想要更深入的詳細資訊,請參閱 Amazon SageMaker Canvas 設定和許可管理 (適用於 IT 管理員)為您的使用者設定 SageMaker Canvas。

設定 Amazon SageMaker Canvas 的先決條件

若要設定 SageMaker Canvas 應用程式,請使用下列其中一種設定方法加入:

  1. 使用 AWS 主控台加入。若要透過 AWS 主控台加入,請先建立 Amazon SageMaker AI 網域。SageMaker AI 網域支援各種機器學習 (ML) 環境,例如 Canvas 和 SageMaker Studio。如需網域的詳細資訊,請參閱Amazon SageMaker AI 網域概觀

    1. (快速) 使用 Amazon SageMaker AI 的快速設定 – 如果您想要快速設定網域,請選擇此選項。這會授予您的使用者所有預設的 Canvas 許可和基本功能。管理員稍後可以啟用任何其他功能,例如文件查詢。如果您想要設定更精細的許可,建議您改為選擇進階選項。

    2. (標準) 使用 Amazon SageMaker AI 的自訂設定 – 如果您想要完成更進階的網域設定,請選擇此選項。維持對使用者許可的精細控制,例如資料準備功能的存取、生成式 AI 功能和模型部署。

  2. 加入 AWS CloudFormation。 AWS CloudFormation會自動佈建資源和組態,以便您可以同時為一或多個使用者設定檔設定 Canvas。如果您想要大規模自動化加入程序,並確定您的應用程式每次都以相同的方式設定。下列 CloudFormation 範本提供簡化的 Canvas 加入方式,確保所有必要元件都已正確設定,並可讓您專注於建置和部署機器學習模型。

下一節說明如何使用 AWS 主控台建立網域,以加入 Canvas。

重要

若要設定 Amazon SageMaker Canvas,您的 Amazon SageMaker Studio 版本必須為 3.19.0 以上。有關更新 Amazon SageMaker Studio 的資訊,請參閱關閉並更新 SageMaker Studio Classic

使用 AWS 主控台加入

如果您正在執行快速網域設定,則可以遵循 中的指示使用 Amazon SageMaker AI 的快速設定,略過本節的其餘部分,然後移至 步驟 1:登入 SageMaker Canvas

如果您要執行標準網域設定,則可以指定要授予使用者存取權的 Canvas 功能。當您完成標準網域設定時,請使用本節的其餘部分,以協助您設定 Canvas 特定的許可。

使用 Amazon SageMaker AI 的自訂設定設定說明中,針對步驟 2:使用者和 ML 活動,您必須選取您要授予的 Canvas 許可。在 ML 活動區段中,您可以選取下列許可政策來授予 Canvas 功能的存取權。設定網域時,您最多只能選取總計 8 個 ML 活動。下列清單中的前兩個許可需要使用 Canvas,其餘則用於其他功能。

  • 執行 Studio 應用程式 – 這些許可是啟動 Canvas 應用程式的必要許可。

  • Canvas 核心存取 – 這些許可授予您存取 Canvas 應用程式和 Canvas 的基本功能,例如建立資料集、使用基本資料轉換,以及建置和分析模型。

  • (選用) Canvas Data Preparation (由 Data Wrangler 提供) – 這些許可授予您建立資料流程的存取權,並使用進階轉換在 Canvas 中準備資料。這些許可也是建立資料處理任務和資料準備任務排程的必要許可。

  • (選用) Canvas AI 服務 – 這些許可授予您存取 Canvas Ready-to-use型模型、基礎模型和與資料聊天功能的權限。

  • (選用) Kendra 存取 – 此許可授予您存取文件查詢功能的權限,您可以在其中使用 Canvas 中的基礎模型查詢存放在 Amazon Kendra 索引中的文件。

    如果您選取此選項,請在 Canvas Kendra Access 區段中輸入您要授予存取權的 Amazon Kendra 索引 IDs。

  • (選用) Canvas MLOps – 此許可授予您存取 Canvas 中的模型部署功能,您可以在其中部署模型以用於生產。

在網域設定的步驟 3:應用程式區段中,選擇設定 Canvas,然後執行下列動作:

  1. 針對 Canvas 儲存組態,指定您希望 Canvas 存放應用程式資料的位置,例如模型成品、批次預測、資料集和日誌。SageMaker AI 會在此儲存貯體中建立Canvas/資料夾來存放資料。如需詳細資訊,請參閱設定您的 Amazon S3 儲存。請在本節執行以下動作:

    1. 如果您想要將位置設定為遵循模式 的預設 SageMaker AI 建立的儲存貯體,請選取受管系統s3://sagemaker-{Region}-{your-account-id}

    2. 選取自訂 S3以指定自己的 Amazon S3 儲存貯體為儲存位置。然後,輸入 Amazon S3 URI。

    3. (選擇性) 針對加密金鑰,請指定 KMS 金鑰,以加密儲存在指定位置的 Canvas 成品。

  2. (選擇性) 針對 Canvas 即用型模型組態,請執行下列操作:

    1. 保持啟用 Canvas 即用型模型選項開啟,讓您的使用者有權在 Canvas 中使用即用型模型產生預測 (預設情況為開啟)。此選項也讓您有權與生成型 AI 提供的模型聊天。如需更多資訊,請參閱SageMaker Canvas 中的生成式 AI 基礎模型

    2. 保持使用 Amazon Kendra 啟用文件查詢選項開啟,讓使用者有權使用基礎模型查詢儲存在 Amazon Kendra 索引中的文件。然後,從下拉式選單中選取您要授予存取權的現有索引。如需詳細資訊,請參閱SageMaker Canvas 中的生成式 AI 基礎模型

    3. 針對 Amazon Bedrock 角色,選取建立並使用新的執行角色,以建立新的 IAM 執行角色,該角色與 Amazon Bedrock 具有信任關係。此 IAM 角色由 Amazon Bedrock 擔任,以微調 Canvas 中的大型語言模型 (LLMs)。如果您已有具有信任關係的執行角色,請選取使用現有的執行角色,然後從下拉式清單中選擇您的角色。如需手動設定自己執行角色許可的詳細資訊,請參閱授予使用者在 Canvas 中使用 Amazon Bedrock 和生成式 AI 功能的許可

  3. (選用) 針對機器學習 (ML) 作業許可組態區段,執行下列動作:

    1. 保持開啟啟用 Canvas 模型的直接部署選項,以授予使用者從 Canvas 將模型部署到 SageMaker AI 端點的許可。如需關於在 Canvas 中部署模型的更多相關資訊,請參閱將模型部署到端點

    2. 所有使用者的啟用模型登錄檔註冊許可選項保持開啟,以授予您的使用者將模型版本註冊到 SageMaker AI 模型登錄檔的許可 (預設為開啟)。如需詳細資訊,請參閱在 SageMaker AI 模型登錄檔中註冊模型版本

    3. 如果您讓所有使用者的啟用模型登錄檔註冊許可選項保持開啟,請選取僅註冊到模型登錄檔或在模型登錄檔中註冊並核准模型

  4. (選用) 對於本機檔案上傳組態區段,開啟啟用本機檔案上傳選項,以授予使用者從本機機器上傳檔案至 Canvas 的許可。開啟此選項會將跨來源資源共用 (CORS) 政策連接至 Canvas 儲存組態中指定的 Amazon S3 儲存貯體 (並覆寫任何現有的 CORS 政策)。若要進一步了解本機檔案上傳許可,請參閱 授予使用者上傳本機檔案的許可

  5. (選用) 針對 OAuth 設定區段,執行下列動作:

    1. 選擇新增 OAuth 組態

    2. 針對資料來源,選取您的資料來源。

    3. 針對秘密設定,選取建立新的秘密,並輸入您從身分提供者取得的資訊。如果您尚未使用資料來源完成初始 OAuth 設定,請參閱 使用 OAuth 設定與資料來源的連線

  6. (選擇性) 針對時間序列預測組態,請保持啟用時間序列預測選項開啟,讓您的使用者有權在 SageMaker Canvas 中執行時間序列預測 (依預設為開啟)。

    1. 如果您保持開啟啟用時間序列預測,請選取建立和使用新的執行角色,或者如果您已經有已連接必要 Amazon Forecast 許可的 IAM 角色,請選取使用現有的執行角色 (如需詳細資訊,請參閱 IAM 角色設定方法)。

  7. 使用 使用 Amazon SageMaker AI 的自訂設定 程序完成其餘網域的設定。

注意

如果您在透過主控台授予許可時遇到任何問題,例如即用型模型的許可,請參閱主題對透過 SageMaker AI 主控台授予許可的問題進行故障診斷

您現在應該已設定 SageMaker AI 網域,並設定所有 Canvas 許可。

您可以在初始網域設定後編輯網域或特定使用者的 Canvas 許可。個別使用者設定會覆寫網域設定。若要了解如何在網域設定中編輯您的 Canvas 許可,請參閱 編輯網域設定

授予自己使用 Canvas 中特定功能的許可

以下資訊概述您可以授予 Canvas 使用者的各種許可,以允許在 Canvas 中使用各種功能。其中一些許可可以在網域設定期間授予,但有些則需要額外的許可或組態。請參閱您要啟用之每個功能的特定許可資訊:

  • 本機檔案上傳。設定您的網域時,Canvas 基本許可中預設會開啟本機檔案上傳的許可。如果您無法將本機檔案從機器上傳至 SageMaker Canvas,您可以將 CORS 政策連接至您在 Canvas 儲存組態中指定的 Amazon S3 儲存貯體。如果您允許 SageMaker AI 使用預設儲存貯體,儲存貯體會遵循命名模式 s3://sagemaker-{Region}-{your-account-id}。如需更多資訊,請參閱授予使用者上載本機檔案的許可

  • 自訂影像和文字預測模型。在設定網域時,Canvas 基本許可中預設會開啟建置自訂映像和文字預測模型的許可。不過,如果您有自訂的 IAM 組態且不想將 AmazonSageMaker CanVasFullAccess 政策連接到使用者的 IAM 執行角色,則必須明確授予使用者必要的許可。如需更多資訊,請參閱授予您的使用者建立自訂影像和文字預測模型的許可

  • 即用型模型和基礎模型。您可能想要使用 Canvas Ready-to-use型模型來預測資料。使用Ready-to-use型模型許可,您也可以與生成式 AI 模型聊天。設定網域時,預設會開啟許可,或者您可以編輯已建立之網域的許可。Canvas 即用型模型許可選項會將 AmazonSageMakerCanvasAIServicesAccess 新增至您的執行角色。若要取得更多資訊,請參閱即用型模型文件的開始使用章節。

    如需有關開始使用生成式 AI 基礎模型的更多相關資訊,請參閱SageMaker Canvas 中的生成式 AI 基礎模型

  • 微調基礎模型。如果您想要在 Canvas 中微調基礎模型,您可以在設定網域時新增許可,也可以在建立網域後編輯網域或使用者設定檔的許可。您必須將 AmazonSageMakerCanvasAIServicesAccess 政策新增至您在設定使用者設定檔時選擇的 AWS IAM 角色,而且還必須將與 Amazon Bedrock 的信任關係新增至角色。如需如何將這些許可新增至 IAM 角色的說明,請參閱 授予使用者在 Canvas 中使用 Amazon Bedrock 和生成式 AI 功能的許可

  • 時間序列預測。如果您想要對時間序列資料執行預測,您可以在設定網域時新增時間序列預測許可,也可以在建立網域後編輯網域或使用者設定檔的許可。必要的許可是 AmazonSageMakerCanvasForecastAccess 受管政策,以及與 Amazon Forecast 的信任關係,其與您在設定使用者設定檔時選擇的 AWS IAM 角色相關。如需如何將這些許可新增至 IAM 角色的指示,請參閱授予使用者執行時間序列預測的許可

  • 傳送批次預測到 Amazon QuickSight。您可能想要批次預測或您從自訂模型產生的預測資料集傳送至 Amazon QuickSight 進行分析。在 QuickSight 中,您可以使用預測結果來建立和發佈預測儀表板。如需如何將這些許可新增至 Canvas 使用者 IAM 角色的指示,請參閱授予使用者將預測傳送至 Amazon QuickSight 的許可

  • 將 Canvas 模型部署至 SageMaker AI 端點。SageMaker AI Hosting 提供端點,您可以使用這些端點來部署模型,以便在生產環境中使用。您可以將 Canvas 內建的模型部署到 SageMaker AI 端點,然後在生產環境中以程式設計方式進行預測。如需詳細資訊,請參閱將模型部署到端點

  • 將模型版本註冊到模型註冊表。您可能想要將模型版本註冊到 SageMaker AI 模型登錄檔,這是用於追蹤模型更新版本狀態的儲存庫。在 SageMaker Model Registry 中工作的資料科學家或 MLOps 團隊可以檢視您已建置的模型版本,並核准或拒絕這些版本。然後,他們可以將您的模型版本部署到生產環境中,或啟動自動化工作流程。您的網域預設會開啟模型註冊許可。您可以在使用者設定檔等級中管理該許可,並授予或移除特定使用者的許可。如需詳細資訊,請參閱在 SageMaker AI 模型登錄檔中註冊模型版本

  • 從 Amazon Redshift 匯入資料。如果您想要從 Amazon Redshift 匯入資料,則必須授予自己額外的許可。您必須在設定使用者設定檔時,將 AmazonRedshiftFullAccess 受管政策新增至您選擇的 AWS IAM 角色。如需有關如何將政策新增至角色的指示,請參閱授予使用者匯入 Amazon Redshift 資料的許可

注意

透過其他資料來源 (例如 Amazon Athena 和 SaaS 平台) 進行匯入的必要許可皆包含 AmazonSageMakerFullAccessAmazonSageMakerCanvasFullAccess 政策中。如果您遵循標準設定說明,這些政策應該已連接至您的執行角色。如需有關這些資料來源與其許可的更多相關資訊,請參閱連線至資料來源

步驟 1:登入 SageMaker Canvas

初始設定完成時,您可以使用下列任何方法存取 SageMaker Canvas,視您的使用案例而定:

  • SageMaker AI 主控台中,選擇左側導覽窗格中的 Canvas。然後,在 Canvas 頁面上,從下拉式清單中選取您的使用者,然後啟動 Canvas 應用程式。

  • 開啟 SageMaker Studio,然後在 Studio 界面中,前往 Canvas 頁面並啟動 Canvas 應用程式。

  • 使用組織的 SAML 2.0 型 SSO 方法,例如 Okta 或 IAM Identity Center。

當您第一次登入 SageMaker Canvas 時,SageMaker AI 會為您建立應用程式和 SageMaker AI 空間。Canvas 應用程式的資料會存放在空間中。若要進一步了解空格,請參閱 與共用空間協作。空間包含使用者設定檔的應用程式,以及應用程式所有資料的共用目錄。如果您不想使用 SageMaker AI 建立的預設空間,並偏好建立自己的空間來存放應用程式資料,請參閱頁面 將 SageMaker Canvas 應用程式資料存放在您自己的 SageMaker AI 空間

步驟 2:使用 SageMaker Canvas 取得預測

登入 Canvas 之後,您就可以開始建置模型並產生資料的預測。

您可以使用 Canvas 即用型模型進行預測,而無需建立模型,也可以針對特定業務問題建立自訂模型。檢閱下列資訊,以決定最適合您使用案例的即用型模型或自訂模型。

  • 即用型模型。您可以使用即用型,即預先建立的模型從資料中擷取見解。即用型模型涵蓋了各種使用案例,例如語言偵測和文件分析。若要開始使用即用型模型進行預測,請參閱Ready-to-use型模型

  • 自訂模型。您可以使用自訂模型建立各種模型類型,以便自訂資料預測。如果您想要建置以業務特定資料訓練的模型,以及想要使用評估模型效能等功能,請使用自訂模型。若要開始建置自訂模型,請參閱自訂模型