自訂 RStudio 映像規格 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

自訂 RStudio 映像規格

在本指南中,您將學習自攜您自己的映像時,要使用的自訂 RStudio 映像規格。您必須滿足自訂 RStudio 映像檔的兩組需求,才能將其與 Amazon SageMaker 搭配使用。這些要求是由 RStudio PBC 和 Amazon 工作 SageMaker 室經典平台施加的。如果未符合這兩組要求的其中之一,則您的自訂映像將無法正常運作。

RStudio PBC 要求

RStudio PBC 要求已配置在 使用 Docker 映像搭配 RStudio Workbench/RStudio Server Pro、啟動器和 Kubernetes 文章中。請遵循本文中的指示建立自訂 RStudio 映像的基礎。

如需如何在自訂映像中安裝多個 R 版本的相關指示,請參閱在 Linux 上安裝多個 R 版本

Amazon SageMaker 工作室經典版

Amazon SageMaker 工作室經典版對您的 RStudio 映像實施了以下一組安裝需求。

  • 您必須使用至少 2023.03.2-454.pro2 的 RStudio 基礎映像。如需詳細資訊,請參閱 RStudio 版本控制

  • 您必須安裝以下套件:

    yum install -y sudo \ openjdk-11-jdk \ libpng-dev \ && yum clean all \ && /opt/R/${R_VERSION}/bin/R -e "install.packages('reticulate', repos='https://packagemanager.rstudio.com/cran/__linux__/centos7/latest')" \ && /opt/python/${PYTHON_VERSION}/bin/pip install --upgrade \ 'boto3>1.0<2.0' \ 'awscli>1.0<2.0' \ 'sagemaker[local]<3'
  • 您必須提供 RSTUDIO_CONNECT_URLRSTUDIO_PACKAGE_MANAGER_URL 環境值的預設值。

    ENV RSTUDIO_CONNECT_URL "YOUR_CONNECT_URL" ENV RSTUDIO_PACKAGE_MANAGER_URL "YOUR_PACKAGE_MANAGER_URL" ENV RSTUDIO_FORCE_NON_ZERO_EXIT_CODE 1

下列一般規格適用於以 RStudio 映像版本顯示的映像。

執行映像

ENTRYPOINTCMD 指示均已覆寫,使該映像作為 RSession 應用程式執行。

停止映像

DeleteApp API 為發行與 docker stop 命令的等效的命令。容器中的其他程序將無法取得 SIGKILL/SIGTERM 訊號。

檔案系統

/opt/.sagemakerinternal/opt/ml 目錄已預留。執行階段可能會看不到這些目錄中的任何資料。

使用者資料

SageMaker 網域中的每個使用者都會在映像中的共用 Amazon Elastic File System 磁碟區上取得一個使用者目錄。目前使用者目錄在 Amazon Elastic File System 磁碟區上的位置為 /home/sagemaker-user

中繼資料

中繼資料檔案位於 /opt/ml/metadata/resource-metadata.json。映像中定義的變數不會新增其他環境變數。如需更多更多資訊,請參閱 取得應用程式中繼資料

GPU

在 GPU 執行個體上,會以 --gpus 選項執行映像。映像僅能納入 CUDA 工具包,而非 NVIDIA 驅動程式。如需詳細資訊,請參閱 NVIDIA使用者指南

指標和日誌記錄

來自 RSession 程序的日誌會傳送到客戶帳戶 CloudWatch 中的 Amazon。日誌群組的名稱為 /aws/sagemaker/studio。日誌串流名稱為 $domainID/$userProfileName/RSession/$appName

映像大小

映像大小限制為 25 GB。若要檢視映像大小,請執行 docker image ls