OPS07-BP03 使用執行手冊執行程序 - AWS Well-Architected 架構

OPS07-BP03 使用執行手冊執行程序

路由層 執行手冊 是為了實現特定結果而記錄的程序。執行手冊由一系列可供遵循以完成某項工作的步驟組成。早在航空器製造初期,操作過程中就會使用執行手冊。在雲端操作中,我們使用執行手冊來降低風險及達到預期成果。簡言之,執行手冊就是完成一項工作的檢查清單。

執行手冊是工作負載的運作不可或缺的部分。從新團隊成員的上線到部署主要版本,執行手冊無論由誰使用,都是可提供一致結果的編碼程序。執行手冊應在集中發佈,並隨著程序的演進而更新,因為更新執行手冊是變更管理程序的重要環節。其中也應包含關於問題發生時的錯誤處理、工具、許可、例外狀況和呈報的指引。

隨著組織的成熟,您可以開始將執行手冊自動化。請從簡短且常用的執行手冊開始著手。使用指令碼語言自動執行步驟,或使步驟較容易執行。前幾個執行手冊完成自動化後,您會專注於將較複雜的執行手冊自動化。經過一段時間後,您大多數的執行手冊應該都已做了某種程度的自動化。

預期成果: 您的團隊有一系列執行工作負載任務的逐步指南。執行手冊中包含預期成果、必要的工具和許可,以及錯誤處理指示。這些執行手冊會集中存放,並且經常更新。

常見的反模式:

  • 憑藉記憶完成程序中的每個步驟。

  • 手動部署變更而不使用檢查清單。

  • 不同的團隊成員執行相同程序,但使用的步驟不同,或結果不同。

  • 執行手冊失去與系統變更和自動化的同步。

建立此最佳實務的優勢:

  • 降低手動工作的錯誤率。

  • 以一致的方式執行操作:

  • 新的團隊成員可更快開始執行工作。

  • 可將執行手冊自動化以節省人力。

未建立此最佳實務時的曝險等級:

實作指引

根據組織的成熟度,執行手冊採取數種形式。其中至少應包含逐步說明文字文件。預期成果應明確指出。明確記載必要的特殊許可或工具。提供詳細指引,說明在發生狀況時應如何處理錯誤及呈報。列出執行手冊擁有者,並將其集中發佈。執行手冊列入文件後,應請團隊的其他成員加以執行,以進行驗證。隨著程序的演進,請根據您的變更管理程序更新執行手冊。

隨著組織逐漸成熟,您的文字執行手冊應該要自動化。使用諸如 AWS Systems Manager 自動化的服務,您可以將一般文字轉換為可對工作負載執行的自動化。這些自動化可作為事件的應變動作來執行,以降低您維持工作負載的操作負擔。

客戶範例

AnyCompany Retail 必須在軟體部署期間執行資料庫結構描述更新。雲端維運團隊與資料庫管理團隊共同建置用來手動部署這些變更的執行手冊。執行手冊以檢查清單格式列出了程序中的每個步驟。其中包含相關發生狀況時進行錯誤處理的章節。他們將執行手冊發佈於內部 Wiki,與其他執行手冊放在一起。雲端維運團隊規劃要在未來的衝刺期間將執行手冊自動化。

實作步驟

如果您沒有現有的文件儲存庫,版本控制儲存庫將是您開始建置執行手冊程式庫的絕佳選擇。您可以使用 Markdown 來建置執行手冊。我們提供了範例執行手冊範本,讓您用來開始建置執行手冊。

# 執行手冊標題 ## 執行手冊資訊 | 執行手冊 ID | 描述 | 使用的工具 | 特殊許可 | 執行手冊作者 | 上次更新日期 | 呈報 POC | |-------|-------|-------|-------|-------|-------|-------| | RUN001 | 此執行手冊的用途為何? 預期成果為何? | 工具 | 許可 | 您的名稱 | 2022-09-21 | 呈報名稱 | ## 步驟 1.步驟一 2.步驟二
  1. 如果您沒有現有的文件儲存庫或 Wiki,請在您的版本控制系統中建立新的版本控制儲存庫。

  2. 識別沒有執行手冊的程序。經常執行、步驟數較少,且失敗的影響程度不高的程序,就是理想的程序。

  3. 在您的文件儲存庫中,使用範本建立新的草稿 Markdown 文件。填入 「執行手冊標題」 和必要欄位 (在 「執行手冊資訊」底下)

  4. 從第一個步驟開始,填入執行手冊的 「步驟」 部分。

  5. 將執行手冊提供給團隊成員。讓他們使用執行手冊來驗證步驟。如有任何事項缺漏或需要釐清,請更新執行手冊。

  6. 將執行手冊發佈至您的內部文件存放區。發佈後,請告知團隊和其他利害關係人。

  7. 一段時間後,您會建置執行手冊程式庫。隨著該程式庫的擴增,您應開始設法將執行手冊自動化。

實作計劃的工作量: 低。執行手冊的最低標準是逐步文字指南。將執行手冊自動化可能會增加實作工作量。

資源

相關的最佳實務:

相關文件:

相關影片:

相關範例:

相關服務: