疑難排解 - AWS 截止日期雲端

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

疑難排解

下列程序與秘訣可協助您針對 AWS 截止日期雲端陣列和資源的問題進行疑難排解。

為什麼使用者看不到我的陣列、機群或佇列?

使用者存取

當您的使用者在截止日期雲端監視器中看不到您的陣列、機群或佇列時,他們存取您的陣列和資源可能會發生問題。

無法存取任何陣列的使用者會在截止日期雲端監視器中收到「沒有可用的陣列」訊息。

若要確認您已將正確的使用者或群組指派給您的陣列、機群或佇列
  1. 在 AWS 截止日期雲端主控台中,尋找您的陣列、機群或佇列,然後選擇存取管理

  2. 預設會選取群組索引標籤。如果您要依建議群組指派許可,您的群組應該會顯示在清單中,並具有指派的存取層級。

    如果群組不在清單中,請選擇新增群組以指派群組的許可。

  3. 如果您要依使用者指派許可,請選取使用者索引標籤。您的使用者應該會顯示在清單中,並具有指派的存取層級。

    如果您的使用者不在清單中,請選擇新增使用者以為使用者指派許可。

若要確認您已將使用者指派給您的 群組
  1. 在 AWS 截止日期雲端主控台中,尋找您的陣列、機群或佇列,然後選擇存取管理

  2. 預設會選取群組索引標籤。選取群組名稱以檢視其成員。

  3. 如果使用者未列在群組中,則必須新增使用者。

    如果您使用的是預設身分設定,則可以直接將使用者新增至 Identity Center 主控台中的群組。如果您連線到外部身分提供者,例如 Okta或 Google Workspace,您可以將使用者新增至身分提供者中的 群組。

    注意

    有些外部身分提供者會將使用者而非群組同步至 Identity Center。在這種情況下,請考慮直接將許可指派給使用者,而不是依群組指派許可。

如需管理使用者存取截止日期雲端的詳細資訊,請參閱 在截止日期雲端中管理使用者

為什麼工作者沒有挑選我的任務?

機群角色組態

有時,當工作者建立但未完成初始化且未開始處理任務時,這是因為機群角色未正確設定。

若要驗證是否發生這種情況,請檢查您的 CloudTrail 日誌是否有任何存取遭拒的錯誤。確認存取遭拒問題後,請前往您的機群,並將角色組態更新為正確的許可。如需詳細資訊,請參閱 Deadline Cloud 開發人員指南中的 CloudTrail 日誌

為什麼我的工作者停滯在執行中?

工作者停滯退出 OpenJD 環境

工作者可能會卡在長時間執行的envExit工作階段動作中。如果您使用覆寫 OpenJD 範本並設定環境結束動作逾時超過 5 分鐘的任務範本,可能會發生這種情況。Deadline Cloud Monitor 提供一些可見性,了解在這種情況下停滯的工作者,但需要針對關聯佇列中的可用工作跨參考RUNNING工作者。

若要尋找停滯的工作者,請前往截止日期雲端監視器中的所有機群,並完成下列步驟:

  1. 在工作者狀態欄中,尋找RUNNING工作者。

  2. 從機群詳細資訊區段中,導覽至每個相關聯的佇列。

  3. 在每個相關聯的佇列中,搜尋 RUNNINGREADY或 的任務PENDING。如果所有關聯的佇列在這些狀態下沒有任何任務,則工作者正在執行環境結束。

若要停止工作者停滯在此狀態,請使用下列 AWS CLI 命令:

aws deadline update-worker \ --farm-id $FARM_ID \ --fleet-id $FLEET_ID \ --worker-id $WORKER_ID \ --status STOPPED

執行 命令後,工作者代理程式會在程式結束時重新啟動。然後,工作者會回到線上,並從相關聯的佇列執行更多任務。如果佇列包含的環境結束動作逾時超過 5 分鐘的更多任務,工作者將會再次停滯。如果發生這種情況,您將需要重複此程序,直到不再有工作者停滯離開為止。

若要避免此問題,請在使用任務範本時,將逾時選項設定為不超過 5 分鐘。

對截止日期雲端任務進行故障診斷

如需 AWS 在截止日期雲端中任務常見問題的相關資訊,請參閱下列主題。

為什麼建立我的任務失敗?

任務可能無法通過驗證檢查的一些可能原因包括:

  • 任務範本未遵循 OpenJD 規格。

  • 任務包含太多步驟。

  • 任務包含太多任務總數。

  • 發生內部服務錯誤,導致無法建立任務。

若要查看任務中步驟和任務數量上限的配額,請使用 Service Quotas 主控台。如需詳細資訊,請參閱的配額 Deadline Cloud

為什麼我的任務不相容?

任務與佇列不相容的常見原因包括:

為什麼我的任務卡在 中?

您的任務似乎卡在 READY 狀態的可能原因包括:

為什麼我的任務失敗?

任務可能會因為許多原因而失敗。若要搜尋問題,請開啟截止日期雲端監視器,然後選擇失敗的任務。選擇失敗的任務,然後檢視任務的日誌。如需說明,請參閱在截止日期雲端中檢視工作階段和工作者日誌

  • 如果您看到授權錯誤,或是因為軟體沒有有效的授權而取得浮水印,請確定工作者可以連線到所需的授權伺服器。如需詳細資訊,請參閱《截止日期雲端開發人員指南》中的將客戶受管機群連接至授權端點

  • 最後一個工作階段動作訊息或程序結束碼可能會提供有關工作失敗原因的資訊。如果您使用的是 ,Windows且您的結束代碼為負數,請嘗試搜尋未簽署版本的結束代碼:

    2,147,483,647 - |your exit code|

為什麼我的步驟待定?

當一或多個相依性未完成時,步驟可能會保持在 PENDING 狀態。您可以使用截止日期雲端監視器檢查相依性的狀態。如需說明,請參閱在截止日期雲端中檢視步驟

其他資源

您可以在 GitHub 上找到其他資訊和資源。