為虛擬叢集建立互動端點 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

為虛擬叢集建立互動端點

本主題說明使用 AWS 命令列介面 (AWS CLI) 建立互動式端點的幾種方法,並包含可用組態參數的詳細資訊。

使用 create-managed-endpoint 命令建立互動端點

create-managed-endpoint 命令中指定參數,如下所示。Amazon EMR on EKS支援使用 Amazon 6.7.0 版及更新EMR版本建立互動式端點。

aws emr-containers create-managed-endpoint \ ‐‐type JUPYTER_ENTERPRISE_GATEWAY \ ‐‐virtual‐cluster‐id 1234567890abcdef0xxxxxxxx \ ‐‐name example-endpoint-name \ ‐‐execution-role-arn arn:aws:iam::444455556666:role/JobExecutionRole \ ‐‐release-label emr-6.9.0-latest \ ‐‐configuration-overrides '{ "applicationConfiguration": [{ "classification": "spark-defaults", "properties": { "spark.driver.memory": "2G" } }], "monitoringConfiguration": { "cloudWatchMonitoringConfiguration": { "logGroupName": "log_group_name", "logStreamNamePrefix": "log_stream_prefix" }, "persistentAppUI": "ENABLED", "s3MonitoringConfiguration": { "logUri": "s3://my_s3_log_location" } } }'

如需詳細資訊,請參閱用於建立互動端點的參數

使用JSON檔案中指定的參數建立互動式端點

  1. 建立create-managed-endpoint-request.json檔案並指定端點所需的參數,如下列JSON檔案所示:

    { "name": "MY_TEST_ENDPOINT", "virtualClusterId": "MY_CLUSTER_ID", "type": "JUPYTER_ENTERPRISE_GATEWAY", "releaseLabel": "emr-6.9.0-latest", "executionRoleArn": "arn:aws:iam::444455556666:role/JobExecutionRole", "configurationOverrides": { "applicationConfiguration": [ { "classification": "spark-defaults", "properties": { "spark.driver.memory": "8G" } } ], "monitoringConfiguration": { "persistentAppUI": "ENABLED", "cloudWatchMonitoringConfiguration": { "logGroupName": "my_log_group", "logStreamNamePrefix": "log_stream_prefix" }, "s3MonitoringConfiguration": { "logUri": "s3://my_s3_log_location" } } } }
  2. 搭配使用 create-managed-endpoint 命令與儲存在本機或 Amazon S3 中的 create-managed-endpoint-request.json 檔案路徑。

    aws emr-containers create-managed-endpoint \ ‐‐cli-input-json file://./create-managed-endpoint-request.json ‐‐region AWS-Region

建立互動端點的輸出

在終端中應能看到下列輸出。輸出包括新互動端點的名稱和識別符:

{ "id": "1234567890abcdef0", "name": "example-endpoint-name", "arn": "arn:aws:emr-containers:us-west-2:111122223333:/virtualclusters/444455556666/endpoints/444455556666", "virtualClusterId": "111122223333xxxxxxxx" }

執行 會aws emr-containers create-managed-endpoint建立自我簽署憑證,允許 EMR Studio 和互動式端點伺服器之間的HTTPS通訊。

如果您執行 create-managed-endpoint 且尚未完成先決條件,Amazon 會EMR傳回錯誤訊息,其中包含您必須採取的動作以繼續。

用於建立互動端點的參數

互動端點的必要參數

建立互動端點時,必須指定下列參數:

‐‐type

請使用 JUPYTER_ENTERPRISE_GATEWAY。這是唯一支援的類型。

‐‐virtual-cluster-id

您在 EMR上向 Amazon 註冊的虛擬叢集的識別碼EKS。

‐‐name

互動式端點的描述性名稱,可協助 EMR Studio 使用者從下拉式清單中選取它。

‐‐execution-role-arn

在 EMR上EKS建立作為先決條件一部分的 Amazon IAM任務執行角色的 Amazon Resource Name (ARN)。

‐‐release-label

要用於端點的 Amazon EMR發行版本的發行標籤。例如:emr-6.9.0-latest。Amazon EMR on EKS支援具有 Amazon 6.7.0 版和更新EMR版本的互動式端點。

互動端點的選用參數

建立互動端點時,也可選擇性地指定下列參數:

‐‐configuration-overrides

若要覆寫應用程式的預設組態,請提供組態物件。您可以使用短期語法來提供組態,也可以參考JSON檔案中的組態物件。

組態物件是由分類、屬性和選用的巢狀組態所組成。屬性由您想要在檔案中覆寫的設定組成。您可以為單一JSON物件中的多個應用程式指定多個分類。可用的組態分類會因 Amazon EMR on EKS Release 而有所不同。如需適用於 EMR 上每個版本 Amazon 的組態分類清單EKS,請參閱 Amazon EMR on EKS Releases。除了針對每個版本列出的組態分類之外,互動端點還會引入其他分類 jeg-config。如需詳細資訊,請參閱Jupyter Enterprise Gateway (JEG) 組態選項