使用 SageMaker Python SDK 設定資料輸入模式

焦點模式

使用 SageMaker Python SDK 設定資料輸入模式 - Amazon SageMaker AI

SageMaker Python SDK 提供一般估算器類別及適用於機器學習 (ML) 架構的變體，用於啟動訓練工作。您可以在設定 SageMaker AI Estimator類別或 Estimator.fit方法時指定其中一個資料輸入模式。下列程式碼範本顯示兩種指定輸入模式的方法。

使用估算器類別指定輸入模式


from sagemaker.estimator import Estimator
from sagemaker.inputs import TrainingInput

estimator = Estimator(
    checkpoint_s3_uri='s3://amzn-s3-demo-bucket/checkpoint-destination/',
    output_path='s3://amzn-s3-demo-bucket/output-path/',
    base_job_name='job-name',
    input_mode='File'  # Available options: File | Pipe | FastFile
    ...
)

# Run the training job
estimator.fit(
    inputs=TrainingInput(s3_data="s3://amzn-s3-demo-bucket/my-data/train")
)

如需更多資訊，請參閱 SageMaker Python SDK 文件內的 sagemaker.estimator.Estimator 類別。

透過 estimator.fit()方法指定輸入模式


from sagemaker.estimator import Estimator
from sagemaker.inputs import TrainingInput

estimator = Estimator(
    checkpoint_s3_uri='s3://amzn-s3-demo-bucket/checkpoint-destination/',
    output_path='s3://amzn-s3-demo-bucket/output-path/',
    base_job_name='job-name',
    ...
)

# Run the training job
estimator.fit(
    inputs=TrainingInput(
        s3_data="s3://amzn-s3-demo-bucket/my-data/train",
        input_mode='File'  # Available options: File | Pipe | FastFile
    )
)

如需更多資訊，請參閱 SageMaker Python SDK 文件內的sagemaker.estimator.Estimator.fit 類別方法以及 sagemaker.inputs.TrainingInput 類別。

提示

若要進一步了解如何使用 SageMaker Python SDK 估算器搭配 VPC 組態設定 Amazon FSx for Lustre 或 Amazon EFS，請參閱 SageMaker AI Python SDK 文件中的使用檔案系統做為訓練輸入。

提示

資料輸入模式與 Amazon S3、Amazon EFS 和 FSx for Lustre 整合，是設定資料來源以獲得最佳實務的最佳建議方式。您可以使用 SageMaker AI 受管儲存選項和輸入模式，以策略方式改善資料載入效能，但沒有嚴格限制。您可以直接在訓練容器中撰寫自己的資料讀取邏輯。例如，您可以設定為從不同的資料來源讀取、撰寫自己的 S3 資料載入器類別，或在訓練指令碼中使用第三方架構的資料載入功能。不過，您必須確定指定 SageMaker AI 可以辨識的正確路徑。

提示

如果您使用自訂訓練容器，請務必安裝 SageMaker 訓練工具組，以協助設定 SageMaker 訓練工作的環境。否則，您必須在 Dockerfile 中明確指定環境變數。如需更多資訊，請參閱使用自有的演算法和模型建立容器。

有關如何使用低階 SageMaker API 設定資料輸入模式的更多相關資訊Amazon SageMaker AI 如何提供訓練資訊，請參閱，CreateTrainingJob API 和 AlgorithmSpecification 內的 TrainingInputMode。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

設定訓練任務以存取資料集

設定資料輸入通道以使用 Amazon FSx for Lustre

下一個主題：

設定資料輸入通道以使用 Amazon FSx for Lustre

上一個主題：

設定訓練任務以存取資料集

需要協助？

選取您的 Cookie 偏好設定

自訂 Cookie 偏好設定

必要

效能

功能

廣告

無法儲存 Cookie 偏好設定

使用 SageMaker Python SDK 設定資料輸入模式

提示

提示

提示

下一個主題：

上一個主題：

需要協助？

Related resources

此頁面是否有幫助？

Related resources