容器化筆記本 - AWS IoT Analytics

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

容器化筆記本

本節包含如何使用 Jupyter 記事本建立 Docker 容器的相關資訊。如果您重複使用第三方建置的筆記本,有安全風險:包含的容器可以使用您的使用者許可來執行任意程式碼。此外,筆記本產生的 HTML 可以顯示在AWS IoT Analytics主控台,在顯示 HTML 的電腦上提供潛在的攻擊媒介。在使用任何第三方筆記本之前,請確定您信任其撰寫者。

執行進階分析功能的一個選項是使用 Jupyter 筆記本。Jupyter Notebook 提供了強大的數據科學工具,可以執行機器學習和一系列統計分析。如需詳細資訊,請參閱《》筆記本。(請注意,我們目前不支持內部容器化 JupyterLab。) 您可以將 Jupyter 筆記本和庫打包到一個容器中,該容器在接收到的新批次數據上定期運行AWS IoT Analytics在您定義的差異時間範圍內。您可以排定使用容器的分析工作,以及在指定時間範圍內擷取的新分段資料,然後儲存工作的輸出,以供日 future 排定的分析使用。

如果您已建立 SageMaker 執行個體使用AWS IoT Analytics控制台在 2018 年 8 月 23 日之後,容器化擴展的安裝已自動為您完成你可以開始創建一個容器化的圖像。否則,請按照本節中列出的步驟操作,啟用筆記型電腦容器化 SageMaker 實例。在以下內容中,您修改了 SageMaker 執行角色可讓您將容器映像上傳到 Amazon EC2,並安裝容器化擴充功能。

啟用未透過以下方式建立的筆記本執行個體的容器化AWS IoT Analytics安慰

建議您建立新 SageMaker 執行個體AWS IoT Analytics控制台,而不是遵循這些步驟。新的執行個體自動支援容器化。

如果您重新啟動 SageMaker 執行個體在如下所示啟用容器化之後,您不必重新新增 IAM 角色和政策,但您必須重新安裝擴充功能,如最後一個步驟所示。

  1. 若要授與您的筆記型電腦執行個體存取 Amazon ECS,請選取您的 SageMaker 執行個體上的 SageMaker 頁面:

    容器化筆記本AWS IoT Analytics。
  2. IAM 角色,選擇 SageMaker 執行角色。

    容器化筆記本AWS IoT Analytics。
  3. 選擇 Attach Policy (連接政策),然後定義並連接 Permissions (許可)中所顯示的政策。如果AmazonSageMakerFullAccess策略尚未附加,也請附加它。

    容器化筆記本AWS IoT Analytics。

您也必須從 Amazon S3 下載容器化程式碼,並將其安裝在筆記本執行個體上,第一步是存取 SageMaker 執行個體的終端。

  1. 在木皮特內,選擇全新

    容器化筆記本AWS IoT Analytics。
  2. 從出現的選單中,選擇航站

    容器化筆記本AWS IoT Analytics。
  3. 在終端機內,輸入以下命令來下載程式碼,將其解壓縮並進行安裝。請注意,這些命令會殺死您的筆記本電腦正在運行的任何進程 SageMaker 實例。

    容器化筆記本AWS IoT Analytics。
    cd /tmp aws s3 cp s3://iotanalytics-notebook-containers/iota_notebook_containers.zip /tmp unzip iota_notebook_containers.zip cd iota_notebook_containers chmod u+x install.sh ./install.sh

    等待一兩分鐘以進行驗證和安裝延伸。

更新您的筆記型電腦容器化擴充功能

如果您建立了 SageMaker 透過執行個體AWS IoT Analytics控制台在 2018 年 8 月 23 日之後,然後自動安裝容器化擴充功能。您可以通過重新啟動實例來更新擴展程序 SageMaker 主控台。如果您手動安裝了擴展程序,則可以通過重新運行「啟用未創建的筆記本實例的容器化」中列出的終端命令來更新擴展程序AWS IoT Analytics主控台。

建立容器化映像

在本章節中,我們示範容器化 筆記本所需的步驟。若要開始,請移至您的 Jupyter 筆記本,使用容器化核心建立筆記本。

  1. 在您的 Jupyter 筆記本中,選擇 New (新增),然後從下拉式清單選擇您想要的核心類型。(內核類型應以「容器化」開頭,並以您原本選擇的任何內核結束。 例如,如果您只想要一個普通的 Python 3.0 環境,如「conda_python3」,請選擇「容器化的 conda_python3」)。

    更新您的筆記型電腦容器化擴充功能AWS IoT Analytics。
  2. 在您完成筆記型電腦的工作並想要將其容器化之後,請選擇容器化

    更新您的筆記型電腦容器化擴充功能AWS IoT Analytics。
  3. 輸入容器化筆記本的名稱。您也可以輸入選用說明。

    更新您的筆記型電腦容器化擴充功能AWS IoT Analytics。
  4. 指定您的筆記本應叫用的 Input Variables (輸入變數) (參數)。您可以選擇自動從您的筆記本偵測到的輸入變數,或定義自訂變數。(請注意,如果您有之前已執行的筆記本,則只會偵測到輸入變數)。對於每個輸入變數選擇類型。您也可以輸入輸入變數的選擇性描述。

    更新您的筆記型電腦容器化擴充功能AWS IoT Analytics。
  5. 選擇應將從筆記本建立的映像上傳到的 Amazon ECR 儲存庫。

    更新您的筆記型電腦容器化擴充功能AWS IoT Analytics。
  6. 選擇容器化開始該過程。

    您會看到一個概述,總結您的輸入。請注意,啟動該過程之後,您便無法將其取消。該過程可能持續長達一個小時。

    更新您的筆記型電腦容器化擴充功能AWS IoT Analytics。
  7. 下一頁顯示進度。

    更新您的筆記型電腦容器化擴充功能AWS IoT Analytics。
  8. 如果您不小心關閉瀏覽器,您可以從筆記本的區段AWS IoT Analytics主控台。

  9. 程序完成後,容器化映像會儲存在 Amazon ECR 上,供您使用。

    更新您的筆記型電腦容器化擴充功能AWS IoT Analytics。