疑難排解 - Amazon Elastic Compute Cloud

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

疑難排解

重要

Amazon 彈性圖形於 2024 年 1 月 8 日終止使用壽命。對於需要圖形加速的工作負載,我們建議您使用 Amazon EC2 G4ad、G4dn 或 G5 執行個體。

下列是常見的錯誤和故障診斷步驟。

調查應用程式效能問題

Elastic Graphics 使用執行個體網路將 OpenGL 命令傳送到遠端連接的顯示卡。此外,執行使用 Elastic Graphics 加速器之 OpenGL 應用程式的桌面,通常會使用遠端存取技術存取。區分 OpenGL 轉譯與桌面遠端存取技術相關的效能問題非常重要。

OpenGL 轉譯效能問題

OpenGL 轉譯效能取決於遠端執行個體上產生的 OpenGL 命令和影格數量。

轉譯效能可能因下列因素而異:

  • Elastic Graphics 加速器效能

  • 網路效能

  • CPU 效能

  • 轉譯模型與案例複雜性

  • OpenGL 應用程式行為

評估效能的簡易方法是顯示遠端執行個體的轉譯影格數。Elastic Graphics 加速器在遠端執行個體上最多顯示 25 個 FPS,在降低網路用量的同時實現最佳感知品質。

顯示產生的影格數
  1. 在文字編輯器中開啟下列檔案。如果檔案不存在,請先建立檔案。

    C:\Program Files\Amazon\EC2ElasticGPUs\conf\eg.conf
  2. 識別 [Application] 區段,或新增該區段 (如不存在),然後新增下列組態參數:

    [Application] show_fps=1
  3. 重新啟動應用程式並再次檢查 FPS。

如果 FPS 在更新轉譯場景時達到 15-25 個 FPS,則 Elastic Graphics 加速器執行達到峰值。您碰到的任何其他效能問題都可能與執行個體桌面的遠端存取有關。如果是這種情況,請參閱遠端存取效能問題一節。

如果 FPS 數目低於 15,您可以嘗試下列操作:

  • 選取更強大的圖形加速器類型來提高 Elastic Graphics 加速器效能。

  • 使用以下秘訣來提升整體網路效能:

    • 檢查往來 Elastic Graphics 加速器端點的傳入及傳出頻寬數量。您可以使用下列 PowerShell 指令擷取「彈性圖形」加速器端點:

      PS C:\> (Invoke-WebRequest http://169.254.169.254/latest/meta-data/elastic-gpus/associations/[ELASTICGPU_ID]).content
    • 從執行個體到 Elastic Graphics 加速器端點的網路流量,與 OpenGL 應用程式產生的命令數量有關。

    • 從 Elastic Graphics 加速器端點到執行個體的網路流量,與圖形加速器產生的影格數有關。

    • 如果網路使用率達到執行個體最大網路輸送量,請嘗試使用具有更高網路輸送量限額的執行個體。

  • 改善 CPU 效能:

    • 除了 Elastic Graphics 加速器所需的功能之外,應用程式可能還需要大量的 CPU 資源。如果 Windows 任務管理員回報 CPU 資源使用率過高,請嘗試使用 CPU 能力更強的執行個體。

遠端存取效能問題

連接 Elastic Graphics 加速器的執行個體可以使用不同的遠端存取技術來存取。效能和品質可能因下列因素而異:

  • 遠端存取技術

  • 執行個體效能

  • 用戶端效能

  • 網路延遲以及用戶端與執行個體之間的頻寬

遠端存取通訊協定的可能選擇包括:

  • Microsoft 遠端桌面連線

  • NICE DCV

  • VNC

如需最佳化的詳細資訊,請參閱特定通訊協定。

解決狀況不良問題

如果 Elastic Graphics 加速器的狀態不良,請使用下列故障診斷步驟來解決問題。

檢查執行個體組態

如果 Elastic Graphics 命令列工具 egcli.exe 傳回類似以下的輸出,請確保安全群組設定正確,並且您啟動了已啟用執行個體中繼資料服務的執行個體。

EG Version 1.0.7.4240 (Manager) / N/A (OpenGL Library) / N/A (OpenGL Redirector) EG Status: Out Of Service Something prevented the EG Infrastructure to work properly.

停止並啟動執行個體

如果您的 Elastic Graphics 加速器狀態不良,停止執行個體並再次啟動是最簡單的選項。如需詳細資訊,請參閱 手動停止和啟動執行個體

警告

停止執行個體時,在任何執行個體存放區磁碟區的資料都會清除。若要保留執行個體存放區磁碟區的資料,請將資料備份至持久性儲存。

確認已安裝的元件

開啟 Windows 控制台並確認已安裝以下元件:

  • Amazon Elastic Graphics Manager

  • Amazon Elastic Graphics OpenGL 程式庫

  • Amazon EC2 Elastic GPUs OpenGL 重定向器

如果缺少這些項目的任何一個,您必須手動安裝它們。如需詳細資訊,請參閱 安裝 Elastic Graphics 所需的軟體

檢查 Elastic Graphics 日誌

開啟 Windows 事件檢視器,展開應用程式及服務記錄檔區段,並在下列事件日誌中尋找錯誤:

  • EC2ElasticGPUs

  • EC2ElasticGPUs GUI

為什麼我看到多個 ENI?

使用彈性圖形加速器呼叫 EC2 執行個體時,會StartInstances在執行個體上建立新的彈性網路介面 (ENI),以允許將 OpenGL 命令傳送至遠端連接的圖形卡。

如果您在相同 EC2 執行個體的短時間內 (幾秒鐘或更短) 內呼叫StartInstances多次,則每次呼叫都會建立新的網路介面。但是:

  • Elastic Graphics 加速器只會使用一個網路介面。

  • 額外的網路介面不會產生任何費用,並將在 24 小時內自動釋放。