追蹤 Amazon CloudWatch 網際網路監控器中的即時效能和可用性 (概觀標籤) - Amazon CloudWatch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

追蹤 Amazon CloudWatch 網際網路監控器中的即時效能和可用性 (概觀標籤)

使用 CloudWatch 主控台中的 [網際網路監視器] 底下的 [觀] 索引標籤,以取得監視器追蹤之流量的效能和可用性的高階檢視。此索引標籤也會顯示網際網路流量概觀地圖,其中包含流量叢集,可協助您視覺化應用程式的全域流量,以及運作狀態事件的位置和影響。

運作狀態分數

Health 全狀況分數圖表會顯示全球流量的效能和可用性資訊。 AWS 具有關於不同 ASN 和 AWS 服務之地理位置之間網路流量的網際網路效能和可用性的大量歷史資料。Internet Monitor 會使用從其全球網路佔用量擷取的連線資料,計算網際網路流量的效能和可用性基準。 AWS 這與我們用 AWS 來監控我們自己的互聯網正常運行時間和可用性的數據相同。

網路監視器會使用這些測量結果作為基準,偵測應用程式效能和可用性的下降時機,並與基準進行比較。為方便您查看上述下降情況,我們會以效能分數和可用性分數形式向您回報該資訊。如需詳細資訊,請參閱 使用 CloudWatch 工具和網際網路監視器查詢介面探索您的資料

運作狀態分數圖表包含您所選時段內發生的運作狀態事件。如果發生運作狀態事件,您會在圖表上看到效能或可用性線下降。如果您選取事件,便可看到更多詳細資訊和區間顯示在圖表上,其中包含日期和時間資訊,顯示事件持續的時間長度。

您也可以直接存取各資料點的日誌檔案,查看這些指標。在「動作」功能表中,選擇「檢視 CloudWatch 記錄」。

網際網路流量概觀

網際網路流量概觀地圖會顯示特定於您的最終使用者從中存取應用程式的位置和 ASN 的網際網路流量和運作狀態事件。地圖上的灰色國家/地區為包含應用程式流量的國家/地區。

地圖上的各圓圈表示在您所選時段內某個區域中的運作狀態事件。Internet Monitor 會在偵測到特定臨界值的問題時,建立健康事件, AWS 並在您的其中一個資源與使用者存取您的應用程式的城市網路之間的連線。在地圖上選擇一個圓圈,便會顯示更多有關該位置運作狀態事件的詳細資料。此外,針對具有運作狀態事件的叢集,您可以在地圖下方的 Health events (運作狀態事件) 資料表中查看詳細資訊。

請注意,如果網路監視器判斷事件對應用程式有重大全域影響,會在監視器中建立運作狀態事件。如果在您所選時段內,未有任何運作狀態事件對用戶端位置的流量影響超過閾值,則地圖會顯示空白。如需詳細資訊,請參閱網路監視器建立和解決運作狀態事件的時機

變更運作狀態事件閾值

您可以針對網路監視器為應用程式建立運作狀態事件的方式和時機,設定幾個選項。選擇更新閾值即可變更。

您可以變更觸發網路監視器建立運作狀態事件的整體閾值。效能分數和可用性分數的預設運作狀態事件閾值都是 95%。也就是說,應用程式的整體效能或可用性分數降至 95% 或以下時,網路監視器會建立運作狀態事件。對於整體閾值而言,運作狀態事件可能由單一大型問題或多個較小問題觸發。

您也可以變更本機 (即城市網路) 閾值及整體影響程度百分比,它們結合起來會觸發運作狀態事件。設定閾值,在分數低於一或多個城市網路 (位置和 ASN,通常是 ISP) 的閾值時建立運作狀態事件,您便可深入了解流量較低的地點何時發生問題等。

其他本機閾值選項可與可用性或效能評分的本機閾值搭配使用。第二個因素是網路監視器根據本機閾值建立運作狀態事件之前,必須受到影響的整體流量百分比。

透過設定總流量和本機流量的閾值選項,可微調建立運作狀態事件的頻率,以符合您的應用程式用途和需求。請注意,將局部閾值設得較低時,通常會建立更多運作狀態事件,這取決於您的應用程式和您設定的其他閾值組態值。

總而言之,您可以使用下列方式,為效能分數、可用性分數或兩者,設定運作狀態事件閾值:

  • 選擇其他全域閾值來觸發運作狀態事件。

  • 選擇其他局部閾值來觸發運作狀態事件。您也可以使用此選項,變更網路監視器建立事件之前,必須超過之對整體應用程式造成影響的百分比。

  • 選擇關閉根據局部閾值觸發運作狀態事件,或啟用局部閾值選項。

您也可以設定效能分數、可用性分數或兩者的選項。您可以設定一組選項,或只設定其中一個選項。

若要更新效能分數、可用性分數或兩者的閾值和其他組態選項,請執行下列動作:

變更閾值組態選項
  1. 在中 AWS Management Console,瀏覽至 CloudWatch,然後在左側導覽窗格中選擇 [網際網路監視器]。

  2. 概觀標籤的運作狀態事件時間表區段中,選擇更新閾值

  3. 在開啟的對話方塊頁面上,針對觸發網路監視器建立運作狀態事件的閾值和其他選項,選擇想要的新值和選項。您可以執行下列任何操作:

    • 可用性分數閾值效能分數閾值或兩者,選擇新值。

      每個設定的區段中的圖表,會顯示您應用程式可用性或效能的目前閾值設定和實際最近運作狀態事件分數。檢視一般值,您可以了解建議將閾值變更為的值。

      提示:若要檢視較大圖表並變更時間範圍,請選擇圖表右上角的展開按鈕。

    • 選擇開啟或關閉可用性、效能或兩者的局部閾值。啟用選項時,您可以設定希望網路監視器建立運作狀態事件時的閾值和影響等級。

  4. 設定閾值選項之後,請選擇更新運作狀態事件閾值以儲存更新。

若要進一步了解運作狀態事件的運作方式,請參閱網路監視器建立和解決運作狀態事件的時機

運作狀態事件表

運作狀態事件資料表會列出受運作狀態事件影響的用戶端位置,以及事件的相關資訊。下列資料欄包含在資料表中。

描述
用戶端位置

受事件影響、遭遇延遲增加或可用性降低之最終使用者的位置。

若要進一步了解網路監視器中的用戶端位置準確度,請參閱網路監視器中的地理位置資訊和準確度

流量影響

事件造成的影響程度 (延遲增加程度或可用性降低程度)。對於延遲,這是事件期間延遲增加的百分比,相較於從此用戶端位置到使用此用戶端網路的此 AWS 位置的一般流量效能。

用戶端網路

流量行經的網路。一般而言,此為網路流量的網際網路服務供應商 (ISP) 或自治系統編號 (ASN)。

AWS 位置

網路流量的 AWS 位置,可以是 AWS 區域 或網際網路邊緣位置。

影響類型

運作狀態事件的影響類型。運作狀態事件通常是由延遲增加 (效能問題) 或可達性 (可用性問題) 所造成。

您也可以按一下影響類型,以查看造成損害的原因。網際網路監視器可能會分析健全狀況事件的來源,以判斷其是由 AWS ASN (網際網路服務提供者) 所造成。

請注意,此分析會在事件解決後繼續進行。網路監視器最多可以使用新資訊更新事件一小時。

如果您在運作狀態事件資料表中選擇其中一個用戶端位置,則可查看該位置運作狀態事件的詳細資料。例如,您可以查看事件的開始和結束時間,以及本機流量影響。

網路路徑視覺化

完整的損害分析在網路路徑視覺化下具有完整的網路路徑。完整路徑會針對健全狀況事件,顯示應用程式網路路徑上的每個節點,位置與用戶端之間的用戶端- AWS 位置與用戶端之間,以及用戶端-位置配對。

如果網路監視器判定了損害的原因,將標示一個紅色虛線圓圈。損害可能是由 ASN [通常為網際網路服務供應商 (ISP)] 造成,也可能是由 AWS造成。若有數個造成損害的原因,則會圈出多個節點。