本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
限制和考量事項
檢閱下列限制條件,確保您的筆記本工作順利完成。Studio 使用 Papermill 執行筆記本。您可能需要更新 Jupyter 筆記本以符合 Papermill 的要求。LCC指令碼的內容也有限制,以及需要瞭解有關VPC組態的重要詳細資料。
JupyterLab 版本
JupyterLab 支持 3.0 及更高版本。
安裝需要重新啟動核心的套件
Papermill 不支援調用 pip install
來安裝需要重新啟動內核的軟體套件。在此情況下,請在初始化指令碼中使用 pip install
。對於不需要重新啟動核心的套件安裝,您仍然可以在筆記本中包含 pip install
。
使用 Jupyter 註冊的核心和語言名稱
Papermill 會為特定內核和語言註冊翻譯器。如果您使用自己的 instance (BYOI),請使用下列程式碼片段所示的標準核心名稱:
papermill_translators.register("python", PythonTranslator) papermill_translators.register("R", RTranslator) papermill_translators.register("scala", ScalaTranslator) papermill_translators.register("julia", JuliaTranslator) papermill_translators.register("matlab", MatlabTranslator) papermill_translators.register(".net-csharp", CSharpTranslator) papermill_translators.register(".net-fsharp", FSharpTranslator) papermill_translators.register(".net-powershell", PowershellTranslator) papermill_translators.register("pysparkkernel", PythonTranslator) papermill_translators.register("sparkkernel", ScalaTranslator) papermill_translators.register("sparkrkernel", RTranslator) papermill_translators.register("bash", BashTranslator)
參數和環境變數限制
參數和環境變數限制。您建立筆記本工作時,該工作會接收您指定的參數和環境變數。您最多可以傳遞 100 個參數。每個參數名稱最多可以有 256 個字元,相關聯的值最多可以有 2500 個字元。如果傳遞環境變數,您最多可以傳遞 28 個變數。變數名稱和相關聯值的最多可以有 512 個字元。如果您需要的環境變數數量超過 28 個,請在對您可以使用的環境變數沒有數量限制的初始化指令碼中使用其他環境變數。
檢視工作和工作定義
檢視工作和工作定義。如果您在筆記本的 Studio UI 中排程 JupyterLab 筆記本工作,則可以在 Studio UI 中檢視筆記本工作和筆記本工作定義。如果您使用 SageMaker Python 排程筆記本工作SDK,則只能檢視工作 — SageMaker Python SDK 筆記本作業步驟不會建立工作定義。若要檢視工作,您還需要為筆記本作業步驟實例提供額外的標籤。如需詳細資訊,請參閱 在 Studio UI 儀表板中檢視筆記本工作。
映像
您需要根據您在 Studio 中執行筆記本工作或管線中的 SageMaker Python SDK 筆記本作業步驟來管理映像限制。
SageMaker筆記型電腦工作的影像限制 (Studio)
映像和內核支援。啟動筆記本工作的驅動程式假設存在下列事實:
-
基本 Python 運行時環境安裝在工作室或 bring-your-own (BYO)圖像中,並且是 shell 中的默認設置。
-
基本 Python 執行期環境包括 Jupyter 用戶端,其中包含正確設定的核心核規格。
-
基本 Python 執行期環境包括
pip
函式,因此筆記本工作可以安裝系統依賴項。 -
對於具有多個環境的映像,您的初始化指令碼應該在安裝特定於筆記本的套件之前,切換到適當的核心特定環境。在設定核心 Python 執行期環境之後,您應該切換回預設的 Python 執行期環境 (如果與核心執行期環境不同)。
啟動筆記本作業的驅動程式是 bash 指令碼,Bash v4 必須在 /bin/bash 中可用。
bring-your-own-images (BYOI) 上的根權限。您必須擁有自己 Studio 映像的 root 權限,無論是具有 root 使用者身分還是擁有 sudo
存取權。如果您不是 root 使用者,而是能夠透過 sudo
存取 root 權限,請使用 1000/100
作為 UID/GID
。
SageMakerPython SDK 筆記型電腦工作的影像限制
筆記本工作步驟支援下列影像:
-
SageMaker 中列出的分發映像Amazon SageMaker 圖像可與經典工作室一起使用。
-
根據上一個清單中「 SageMaker 分佈」影像的自訂影像。使用分SageMaker 佈映像
作為基礎。 -
已預先安裝筆記型電腦工作相依性的自訂映像檔 (即 sagemaker-headless-execution-driver
. BYOI 您的影像必須符合下列要求: -
此映像已預先安裝筆記型電腦工作相依性。
-
基本 Python 運行時環境已安裝,並且在 shell 環境中默認。
-
基本 Python 執行期環境包括 Jupyter 用戶端,其中包含正確設定的核心核規格。
-
您擁有 root 權限,無論是以 root 使用者身分或透過
sudo
存取權。如果您不是 root 使用者,而是能夠透過sudo
存取 root 權限,請使用1000/100
作為UID/GID
。
-
VPC建立工作期間使用的子網路
如果您使用VPC,Studio 會使用您的私有子網路來建立您的工作。指定一到五個私有子網路 (和 1-15 個安全群組)。
如果您使用私VPC有子網路,則必須選擇下列其中一個選項,以確保筆記本工作可以連線至相依服務或資源:
-
如果工作需要存取 AWS 支持接口VPC端點的服務,創建一個端點以連接到服務。如需支援介面端點的服務清單,請參閱 AWS 與之整合的服務 AWS PrivateLink。 如需建立介面VPC端點的相關資訊,請參閱存取 AWS 使用接口VPC端點的服務。至少必須提供 Amazon S3 VPC 端點閘道。
-
如果筆記本工作需要存取 AWS 不支援介面VPC端點或外部資源的服務 AWS,建立NAT閘道並設定您的安全群組以允許輸出連線。如需設定NAT閘道的相關資訊VPC,請參閱 Amazon 虛擬私VPC有雲端使用者指南中的使用公有和私有子網路 (NAT)。
服務限制
由於筆記型電腦工作排程器是從管道、 SageMaker 訓練和 Amazon EventBridge 服務建立,因此您的筆記型電腦任務會受到其服務特定配額的限制。如果超出這些配額,您可能會看到與這些服務相關的錯誤訊息。例如,與一次可以執行的管道數量,以及單一事件匯流排可以設定的規則數量相關的限制。如需有關 SageMaker 配額的詳細資訊,請參閱 Amazon SageMaker 端點和配額。如需有關 EventBridge 配額的詳細資訊,請參閱 Amazon EventBridge 配額。