用於 SCIKIT 學習和火 SageMaker 花 ML 的預構建 Amazon 碼頭圖像 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

用於 SCIKIT 學習和火 SageMaker 花 ML 的預構建 Amazon 碼頭圖像

SageMaker 提供預先構建的 Docker 映像,用於安裝 SCIKIT 學習和 Spark ML 庫。這些程式庫也包含建置與 SageMaker 使用 Amazon SageMaker Python 開發套件相容的 Docker 映像所需的相依性。透過此軟體開發套件,您可以使用 scikit-learn 來執行機器學習任務,並使用 Spark ML 來建立和調整機器學習管道。如需有關安裝和使用此開發套件的指示,請參閱 SageMaker Python 開發套件

使用開 SageMaker Python 套件

下表包含 GitHub 存儲庫的鏈接,其中包含 SCIKIT 學習和 Spark ML 容器的源代碼。此表格也包含指示連結,說明如何將這些容器與 Python 開發套件估算器搭配使用,以執行您自己的訓練演算法並託管您自己的模型。

有關 GitHub 儲存器的更多資訊和連結,請參閱使用科學套件學習與 Amazon SageMaker使用 SparkML 服務與 Amazon SageMaker

手動指定預先建立的映像

如果您沒有使用 SageMaker Python SDK 及其中一個估計器來管理容器,則必須手動檢索相關的預構建容器。 SageMaker預構建的碼頭映像存儲在 Amazon Elastic Container Registry (Amazon ECR) 中。您可以使用其完整名稱註冊表地址推送或拉取它們。 SageMaker 使用以下碼頭圖像網址模式為科學套件學習和火花 ML:

  • <ACCOUNT_ID>.dkr.ecr.<REGION_NAME>.amazonaws.com/sagemaker-scikit-learn:<SCIKIT-LEARN_VERSION>-cpu-py<PYTHON_VERSION>

    例如:746614075791.dkr.ecr.us-west-1.amazonaws.com/sagemaker-scikit-learn:1.2-1-cpu-py3

  • <ACCOUNT_ID>.dkr.ecr.<REGION_NAME>.amazonaws.com/sagemaker-sparkml-serving:<SPARK-ML_VERSION>

    例如:341280168497.dkr.ecr.ca-central-1.amazonaws.com/sagemaker-sparkml-serving:2.4

如需帳戶 ID 和 AWS 區域名稱,請參閱 Docker 登錄路徑和範例程式碼

尋找可用的映像

使用以下命令來尋找可用的映像版本。例如,使用下列指令尋找 ca-central-1 區域中的可用 sagemaker-sparkml-serving 映像:

aws \ ecr describe-images \ --region ca-central-1 \ --registry-id 341280168497 \ --repository-name sagemaker-sparkml-serving