本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
監控 MediaPackage、CDN 和 MediaTailor 整合的效能
AWS Elemental MediaTailor 需要有效的監控,才能維持 AWS Elemental MediaPackage 和內容交付網路 (CDN) 整合的最佳效能。本主題針對要追蹤的關鍵指標、要使用的監控工具,以及如何設定主動問題偵測提醒提供指引。
設定監控之前,請確定您的基本整合正常運作。如果您尚未完成基本內容交付網路整合設定,請從 開始整合 MediaTailor 與 MediaPackage 和 CDN 。如果您需要對透過監控發現的問題進行故障診斷,請參閱 CDN 整合疑難排解。
關鍵效能指標
監控這些基本指標,以確保 MediaPackage 和 CDN 整合的最佳效能:
CDN 效能指標
如需完整的 CDN 效能指標,包括快取命中率目標、原始請求磁碟區監控和回應時間基準,請參閱 CDN 最佳化指南CDN 和 MediaTailor 整合的效能基準中的 。
CDN 指標的關鍵 EMP 特定考量事項:
- EMP 快取控制標頭
-
要驗證的內容:確保您的 CDN 遵守 EMP 的快取控制標頭,以獲得最佳 TTL 行為
預期行為:根據 EMP 的標頭,不同的內容類型應具有不同的快取持續時間
如需 EMP 快取最佳化的詳細指引,請參閱 最佳化 MediaTailor 和 MediaPackage 內容交付的 CDN 快取。
- 查詢參數影響
-
要監控的內容:追蹤 EMP 特定的查詢參數如何影響快取效率
最佳化目標:確保快取金鑰中僅包含必要的 EMP 查詢參數
- CDN 回應時間
-
要監控的內容:追蹤不同內容類型的回應時間 (資訊清單與區段)。
目標值:
-
快取內容:少於 100 毫秒
-
原始請求:少於 500 毫秒
-
MediaPackage 效能指標
- 錯誤率
-
要監控的內容:從 CDN 和 MediaPackage 端點監控 HTTP 錯誤率。請特別注意 4xx 錯誤,這可能表示組態問題。
金鑰錯誤代碼:
-
400 個錯誤:通常與資訊清單篩選問題相關
-
404 錯誤:可能表示路由或組態問題
-
504 錯誤:逾時問題,特別是 LL-HLS
-
- 請求磁碟區和模式
-
要監控的內容:追蹤 MediaPackage 端點的請求模式,以識別用量趨勢和容量需求。
要監看的模式:
-
尖峰使用時間
-
請求的地理分佈
-
內容類型分佈 (即時與隨需)
-
延遲指標
- End-to-end延遲
-
要監控的內容:對於 LL-HLS 實作,監控從內容擷取到檢視器播放end-to-end延遲。高延遲可能表示 CDN 組態問題。
目標值:
-
LL-HLS:不到 3 秒glass-to-glass延遲
-
一般 HLS:少於 30 秒
-
- 資訊清單產生時間
-
要監控的內容:MediaPackage 產生資訊清單所需的時間,尤其是套用篩選時。
目標值:資訊清單產生少於 200 毫秒
監控工具和設定
設定全面的監控工具對於維持最佳效能以及在問題影響瀏覽者之前快速識別問題至關重要。如果沒有適當的監控,效能降低、快取效率低落或整合問題可能會被忽略,直到觀眾的播放品質不佳為止。正確的監控設定可讓您了解 MediaPackage 和 CDN 整合的所有層面。
使用這些 AWS 服務和工具來監控您的 MediaPackage 和 CDN 整合:
Amazon CloudWatch
Amazon CloudWatch 提供監控 MediaPackage 和 CDN 整合的基礎,方法是從這兩個服務收集和儲存指標。適當的 CloudWatch 組態可確保您擁有識別效能趨勢、疑難排解問題和最佳化整合所需的資料。如果沒有 CloudWatch 指標,您將無法查看系統效能,而且在問題變得嚴重之前可能無法偵測到問題。
針對全方位指標集合設定 CloudWatch 監控:
-
MediaPackage 指標:啟用 MediaPackage 端點的 CloudWatch 指標,以追蹤請求磁碟區、錯誤率和回應時間。
-
CDN 指標:設定 CloudWatch 以收集 CloudFront 指標,包括快取命中率、原始伺服器請求計數和錯誤率。
-
自訂指標:為特定業務 KPIs例如檢視器參與度或內容熱門度。
CloudWatch 儀表板
建立全方位儀表板以視覺化您的指標:
-
概觀儀表板:顯示整體系統運作狀態的高階指標
-
CDN 效能儀表板:詳細 CDN 指標,包括快取效能和地理分佈
-
MediaPackage 效能儀表板:MediaPackage 特定的指標,包括請求模式和錯誤率
-
延遲儀表板:不同內容類型和區域的End-to-end延遲指標
日誌分析
設定日誌分析以進行詳細疑難排解:
-
CDN 存取日誌:啟用和分析 CDN 存取日誌,以了解請求模式並識別問題
-
MediaPackage CloudWatch 日誌:監控 MediaPackage 日誌是否有錯誤和效能問題
-
日誌彙總:使用 Amazon CloudWatch Logs Insights 或第三方工具分析日誌模式
設定提醒和通知
警示組態對於主動偵測和解決問題至關重要。如果沒有適當的提醒,問題可能會在大幅影響瀏覽者體驗或導致服務中斷之前未被發現。設定良好的提醒可協助您在問題影響瀏覽者之前識別和解決問題,並確保您的團隊收到需要立即關注的關鍵問題通知。
設定主動提醒,在問題影響瀏覽者之前識別問題:
關鍵警示
設定重大問題的立即提醒:
-
高錯誤率:當 4xx 或 5xx 錯誤率在 5 分鐘內超過 5% 時發出警示
-
快取命中率下降:當資訊清單的快取命中率低於 70% 或區段的 85% 時發出警示
-
高延遲:end-to-end延遲超過目標閾值時發出警示
-
原始伺服器請求峰值:原始伺服器請求相較於基準增加超過 50% 時發出警示
警告提醒
針對可能表示發生問題的趨勢設定警告提醒:
-
逐漸降低效能:回應時間在 30 分鐘期間增加 20% 時發出警示
-
快取效率趨勢:當快取命中率顯示隨時間下降的趨勢時發出警示
-
異常流量模式:針對請求量或地理分佈中的意外變更發出警示
使用監控資料進行最佳化
利用監控資料來持續改善效能:
定期效能審查
-
每週審查:分析每週效能趨勢並識別最佳化機會
-
每月容量規劃:使用流量模式來規劃容量需求和 CDN 最佳化
-
每季架構審查:評估整體架構效率並識別需要改進的領域
常見的最佳化動作
根據監控資料,請考慮下列最佳化動作:
-
快取政策調整:根據實際的內容更新模式修改 TTL 值。如需詳細的 TTL 最佳化指引,請參閱 CDN 和 MediaTailor 整合的快取最佳化。
-
地理最佳化:在高流量區域中新增 CDN 節點
-
查詢參數最佳化:移除片段快取不必要的查詢參數
-
原始伺服器遮罩組態:在具有高原始伺服器請求磁碟區的區域中實作原始伺服器遮罩
如需 MediaPackage 特有的詳細監控指引,請參閱 MediaPackage 使用者指南中的監控 MediaPackage。