故障診斷 Neo 編譯錯誤 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

故障診斷 Neo 編譯錯誤

本節包含如何了解並防止常見的編譯錯誤、其所產生錯誤訊息的資訊,以及如何解決這些錯誤的指導方針。

如何使用此頁面

請依照下列順序瀏覽這些區段,嘗試解決您的錯誤:

  1. 檢查編譯任務的輸入是否符合輸入要求。請參閱 SageMaker Neo 期望什麼樣的輸入數據形狀?

  2. 檢查常見的 framework-specific 錯誤

  3. 檢查您的錯誤是否為基礎設施錯誤

  4. 檢查您的編譯日誌

錯誤 解決方案

InputConfiguration: No h5 file provided in <model path>

檢查您的 h5 檔案是否位於您所指定的 Amazon S3 URI 中。

檢查 h5 檔案格式是否正確

InputConfiguration: Multiple h5 files provided, <model path>, when only one is allowed

檢查您是否只提供一個 h5檔案。

ClientError: InputConfiguration: Unable to load provided Keras model. Error: 'sample_weight_mode'

檢查您指定的 Keras 版本是否受到支援。請參閱雲端執行個體邊緣裝置支援的架構。

ClientError: InputConfiguration: Input input has wrong shape in Input Shape dictionary. Input shapes should be provided in NCHW format.

檢查您的模型輸入是否遵循 NCHW 格式。請參閱 SageMaker Neo 期望何種輸入資料形式?

錯誤 解決方案

ClientError: InputConfiguration: Only one parameter file is allowed for MXNet model. Please make sure the framework you select is correct.

SageMaker Neo 將選擇給出編譯的第一個參數文件。

錯誤 解決方案

InputConfiguration: Exactly one .pb file is allowed for TensorFlow models.

請確定您只提供一個 .pb 或 .pbtxt 檔案。

InputConfiguration: Exactly one .pb or .pbtxt file is allowed for TensorFlow models.

請確定您只提供一個 .pb 或 .pbtxt 檔案。

ClientError: InputConfiguration: TVM cannot convert <model zoo> model. Please make sure the framework you selected is correct. The following operators are not implemented: {<operator name>}

檢查您所選的運算子是否受到支援。請參閱 SageMaker Neo 支援的架構和運算子

錯誤 解決方案

InputConfiguration: We are unable to extract DataInputConfig from the model due to input_config_derivation_error. Please override by providing a DataInputConfig during compilation job creation.

執行下列任何一項:

  • 在編譯請求中提供 DataInputConfig定義,以指定預期輸入的名稱和形狀。

  • 調查 Amazon CloudWatch 日誌中的錯誤。檢查 /aws/sagemaker/CompilationJobs日誌群組並尋找名為 compilationJobName/model-info-extraction的日誌串流。

基礎設施相關錯誤

錯誤 解決方案

ClientError: InputConfiguration: S3 object does not exist. Bucket: <bucket>, Key: <bucket key>

檢查您提供的 Amazon S3 URI。

ClientError: InputConfiguration: Bucket <bucket name> is in region <region name> which is different from AWS Sagemaker service region <service region>

建立與服務位於同一區域的 Amazon S3 儲存貯體。

ClientError: InputConfiguration: Unable to untar input model. Please confirm the model is a tar.gz file

檢查您在 Amazon S3 中的模型是否已壓縮到 tar.gz檔案中。

檢查您的編譯日誌

  1. CloudWatch 在 https://console.aws.amazon.com/cloudwatch/ 上導航到 Amazon。

  2. 從右上角的 Region (區域) 下拉式清單中,選取您建立編譯任務的區域。

  3. 在 Amazon 的導航窗格中 CloudWatch,選擇日誌。選取 Log groups (日誌群組)。

  4. 搜尋名為 /aws/sagemaker/CompilationJobs的日誌群組。選取日誌群組。

  5. 搜尋以編譯任務名稱命名的日誌串流。選取日誌串流。