使用本機模式執行管道

SageMaker 在受管 SageMaker 服務上執行管道之前，管道本機模式是測試訓練、處理和推論指令碼以及管道參數執行期相容性的簡單方法。透過使用本機模式，您可以使用較小的資料集在本機測試 SageMaker 管道。這樣一來，您可以快速輕鬆地對使用者命令碼和管道定義中的錯誤進行偵錯，而不會產生使用受管服務的成本。下列主題說明如何在本機定義和執行管道。

管道本機模式會利用機罩下的SageMaker 本機模式任務。這是 SageMaker Python 中的一項功能SDK，可讓您使用 Docker 容器在本機執行 SageMaker 內建或自訂映像。管道本機模式建立在 SageMaker 任務本機模式之上。因此，您看到的結果應當與單獨執行這些工作相同。例如，本機模式仍使用 Amazon S3 上傳模型成品和處理輸出。如果希望本機工作產生的資料存放在區域磁碟上，您可以使用本機模式中提到的設定。

管道本機模式目前支援下列步驟類型：

與允許使用平行組態平行執行多個步驟的受管管道服務不同，本機管道執行程式會依序執行步驟。因此，本機管道的整體執行效能可能會比在雲端上執行的管道差，這主要取決於資料集的大小、演算法以及本機電腦的功能。另請注意，在本機模式下執行的管道不會記錄在SageMaker 實驗中。

注意

管道本機模式與 SageMaker 演算法不相容，例如 XGBoost。如果想要使用這些演算法，則必須在指令碼模式中使用。

為了在本機執行管道，與管道步驟和管道本身相關聯的 sagemaker_session 欄位的類型必須是 LocalPipelineSession。下列範例示範如何定義 SageMaker 管道以在本機執行。



from sagemaker.workflow.pipeline_context import LocalPipelineSession
from sagemaker.pytorch import PyTorch
from sagemaker.workflow.steps import TrainingStep
from sagemaker.workflow.pipeline import Pipeline

local_pipeline_session = LocalPipelineSession()

pytorch_estimator = PyTorch(
    sagemaker_session=local_pipeline_session,
    role=sagemaker.get_execution_role(),
    instance_type="ml.c5.xlarge",
    instance_count=1,
    framework_version="1.8.0",
    py_version="py36",
    entry_point="./entry_point.py",
)

step = TrainingStep(
    name="MyTrainingStep",
    step_args=pytorch_estimator.fit(
        inputs=TrainingInput(s3_data="s3://amzn-s3-demo-bucket/my-data/train"),
    )
)

pipeline = Pipeline(
    name="MyPipeline",
    steps=[step],
    sagemaker_session=local_pipeline_session
)

pipeline.create(
    role_arn=sagemaker.get_execution_role(), 
    description="local pipeline example"
)

// pipeline will execute locally
execution = pipeline.start()

steps = execution.list_steps()

training_job_name = steps['PipelineExecutionSteps'][0]['Metadata']['TrainingJob']['Arn']

step_outputs = pipeline_session.sagemaker_client.describe_training_job(TrainingJobName = training_job_name)

準備好在受管 SageMaker 管道服務上執行管道後，您可以在先前的程式碼片段LocalPipelineSession中將取代為 PipelineSession（如下列程式碼範例所示），並重新執行程式碼，以執行管道。



from sagemaker.workflow.pipeline_context import PipelineSession

pipeline_session = PipelineSession()

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

指定自訂執行群組名稱

管道故障診斷