使用 Systems Manager Automation 修復 OpsItem 問題 - AWS Systems Manager

使用 Systems Manager Automation 修復 OpsItem 問題

AWS Systems Manager Automation 可協助您快速修復在 OpsItems 中識別的 AWS 資源問題。自動化使用預先定義的 SSM Automation Runbook 修復常見的 AWS 資源問題。例如,自動化包含執行下列動作的 Runbook:

  • 停止、啟動、重新啟動和終止 Amazon Relational Database Service (Amazon RDS) 和 Amazon Elastic Compute Cloud (Amazon EC2) 執行個體。

  • 建立 AWS 資源,例如 Amazon Machine Images (AMIs)、Amazon Elastic Block Store (Amazon EBS) 快照和 Amazon DynamoDB 備份。

  • 設定要使用 AWS 服務的資源,包括 Amazon EventBridge、AWS CloudTrail 和 Amazon Simple Storage Service (Amazon S3) 儲存貯體日誌和版本控制。

  • 將 AWS Identity and Access Management (IAM) 執行個體描述檔連接至執行個體。

  • 針對 Amazon EC2 執行個體的 RDP 和 SSH 連線問題進行故障診斷。

  • 重設 Amazon EC2 執行個體的存取權。

AWS Management Console 中的每個 OpsItem 都包括 Runbook (Runbook) 區段。

OpsCenter 中 Automation Runbook 功能

下列清單描述了某些可用來協助您執行 Automation Runbook 和修復問題的功能。

  • 當您選擇產生 OpsItem 的 AWS 資源時、OpsCenter 會顯示您可以在該資源上執行的 Automation Runbook 清單。

  • 當您從清單中選擇 Automation Runbook 時,OpsCenter 會預先填寫一些執行文件所需的欄位。

  • OpsCenter 會保留 Automation Runbook 執行特定 OpsItem 的 30 天記錄。

  • Status and results (狀態和結果) 欄位中,您可以選擇狀態來檢視有關該執行的重要詳細資訊,例如 Automation 失敗的原因,以及發生失敗時 Automation Runbook 執行的步驟,如下列範例所示。

    
                            上次執行 Automation Runbook 的狀態資訊。
  • 所選 OpsItem 的 Related resource details (相關資源詳細資訊) 頁面包括 Run automation (執行自動化) 清單。此清單可讓您選擇最近或資源特定的 Automation Runbook,您可以執行以修復問題。此頁面還包含實用的資料提供者,包括 Amazon CloudWatch 指標和警示、AWS CloudTrail 日誌,以及 AWS Config 詳細資訊等。

    
                            您可以執行的可用 Automation Runbook 和「相關資源」索引標籤上可用指標的清單。
  • 您可以在主控台中選擇 Runbook 名稱或使用 Systems Manager Automation Runbook 參考,檢視 Automation Runbook 資訊。

使用 Runbook 修正 OpsItem 問題

當您從 OpsItem 執行 Systems Manager Automation Runbook 時,您可以執行簡單的版本,或者可以選擇 Advanced configuration (進階組態) 選項。Advanced configuration (進階組態) 會在 Systems Manager Automation 中開啟 Runbook,這會提供執行 Runbook 的多種選項。


                    使用 Advanced Configuration (進階組態) 並在 Systems Manager Automation 中開啟的 OpsCenter Runbook

下列程序說明如何執行簡單版本的 Runbook。如需執行 Advanced configuration (進階組態) Runbook 的資訊,請參閱 使用自動化

開始之前

在您執行自動化文件 (Runbook) 來修復 OpsItem 問題之前,請執行下列動作:

  • 驗證您是否具有執行 Systems Manager Automation Runbook 的許可。如需更多詳細資訊,請參閱 設定自動化

  • 收集要執行之自動化的資源特定 ID 資訊。例如,如果您想要執行可重新啟動 EC2 執行個體的自動化,則必須指定要重新啟動的執行個體 ID。

執行 Automation Runbook 修復 OpsItem 問題

  1. 開啟位於 AWS Systems Managerhttps://console.aws.amazon.com/systems-manager/ 的 主控台。https://console.aws.amazon.com/systems-manager/

  2. 在導覽窗格中,選擇 OpsCenter

  3. 選擇 OpsItem ID 以開啟詳細資訊頁面。

    
                            OpsCenter 概觀頁面的新 OpsItem
  4. 捲動至 Runbooks 區段。

  5. 使用 Runbook 搜尋列或右上角的號碼尋找您要執行的 Automation Runbook。

  6. 選擇 Runbook,然後選擇 Execute (執行)

  7. 輸入 Runbook 所需的資訊,然後選擇 Execute (執行)

  8. 在導覽窗格中,選擇 Automation (自動化),然後選擇 Execution ID (執行 ID) 連結,檢視執行的步驟和狀態。

使用關聯的 Runbook

從 OpsItem 執行 Automation Runbook 之後,Runbook 會自動與 OpsItem 的相關資源建立關聯,以供日後參考。相關聯的 Runbook 排名會高於 Runbook (Runbook) 清單中的其他項目。

使用下列處理程序執行已與 OpsItem 中相關資源建立關聯的 Automation Runbook。如需新增相關資源的資訊,請參閱 使用 OpsItems

執行與資源相關聯之 Runbook 以修復 OpsItem 問題

  1. 開啟位於 AWS Systems Managerhttps://console.aws.amazon.com/systems-manager/ 的 主控台。https://console.aws.amazon.com/systems-manager/

  2. 在導覽窗格中,選擇 OpsCenter

  3. 開啟 OpsItem。

  4. Related resources (相關資源) 區段中,選擇您要執行 Automation Runbook 的資源。

  5. 選擇 Run automation (執行自動化),然後選擇您要執行的相關聯 Automation Runbook。

  6. 輸入 Runbook 所需的資訊,然後選擇 Execute (執行)

  7. 在導覽窗格中,選擇 Automation (自動化),然後選擇 Execution ID (執行 ID) 連結,檢視執行的步驟和狀態。