AWS ParallelCluster AMI 定制 - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

AWS ParallelCluster AMI 定制

在某些情況下,建置自訂 AMI AWS ParallelCluster 是必要的。本節涵蓋構建自定義 AWS ParallelCluster AMI 時應考慮的事項。

您可以使用下列其中一種方法建立自訂 AWS ParallelCluster AMI:

  1. 建立組建映像設定檔,然後使用 pcluster CLI 透過 EC2 Image Builder 建置映像。此過程是自動化的,可重複的,並支持監控。若要取得更多資訊,請參閱pcluster影像指令。

  2. 從 AWS ParallelCluster AMI 建立執行個體,然後登入並進行手動修改。最後,使用 Amazon EC2 從修改後的執行個體建立新 AMI。這個過程需要更少的時間。但是,它不是自動化或可重複的,並且不支援使用 pcluster CLI 映像監視命令。

如需這些方法的詳細資訊,請參閱構建自定義 AWS ParallelCluster AMI

AWS ParallelCluster AMI 自訂考量

無論您如何建立自訂映像檔,我們都建議您執行初步驗證測試,並包含規定以監控所建立映像的狀態。

若要使用建置自訂 AMIpcluster,請使用 EC2 Image Builder 用來建立自訂映像檔BuildImage區段來建立自訂映像檔。此Build區段會指定建置映像所需的影像產生器。這包括 ParentImage(基本映像)和Components。I mage Builder 元件會定義一系列步驟,這些步驟是在建立映像檔之前自訂執行個體,或測試由建立的映像檔啟動的執行個體所需的步驟。如需 AWS ParallelCluster 元件範例,請參閱自訂 AMI。該Image部分指定圖像屬性。

當從 pcluster 呼叫build-image以建立自訂映像檔時,Image Builder 會使用組建映像檔組態與說 AWS ParallelCluster 明書來啟動您 AWS ParallelCluster 的. ParentImage Image Builder 會下載元件、執行建置和驗證階段、建立 AMI、從 AMI 啟動執行個體,以及執行測試。程序完成後,Image Builder 會產生新的影像或停止訊息。

執行自訂元件驗證測試

在組態中包含 Image Builder 元件之前,請使用下列其中一種方法對其進行測試和驗證。由於映 Image Builder 程序最多可能需要 1 小時,因此建議您事先測試元件。這可以為您節省大量時間。

腳本大小寫

在建置映像處理序之外的執行中執行個體中測試指令碼,並確認指令碼是否以結束代碼 0 結束。

Amazon 資源名稱(ARN)案例

在建置映像程序之外的執行個體中測試元件文件。若要取得需求清單,請參閱《Image Builder 使用指南》中的〈元件管理員

成功驗證後,將組件添加到構建映像配置

確認自訂元件正在運作之後,請將其新增至 Build 映像組態檔案

使用pcluster指令監視 Image Builder 程序,以協助偵錯

describe-image

使用此命令可監視組建映像狀態。

list-image-log-streams

使用此命令可取得可用來擷取記錄事件的記錄資料流 ID get-image-log-events

get-image-log-events

使用此命令可取得建置映像處理程序事件的記錄資料流。

例如,您可以使用以下命令來結尾構建圖像事件。

$ watch -n 1 'pcluster get-image-log-events -i <image-id> \ --log-stream-name/1 <pcluster-version> \ --query "events[*].message" | tail -n 50'

get-image-stack-events

使用此命令可擷取映像產生器所建立之堆疊的影像堆疊事件。

export-image-logs

使用此指令儲存影像記錄。

如需有關 AWS ParallelCluster 日誌和 Amazon 的詳細資訊 CloudWatch,請參閱亞馬遜CloudWatch日誌構建映像日誌亞馬遜CloudWatch儀表

其他考量

新 AWS ParallelCluster 版本和自訂 AMI

如果您建置並使用自訂 AMI,則必須在每個新 AWS ParallelCluster 版本中重複建立自訂 AMI 時所用的步驟。

自定義引導操作

檢閱此自定義引導操作區段,以確定您要進行的修改是否可以編寫指令碼,並在 future 的 AWS ParallelCluster 版本中提供支援。

使用自訂 AMI

您可以在/CustomAmiScheduling/-Image/NameImage/CustomAmi區段中的叢集配置中指定自訂 AMI。SlurmQueues

若要疑難排解自訂 AMI 驗證警告,請參閱排解自訂 AMI 問題