在 Amazon 上監控 Elastic Fabric Adapter EC2 - Amazon Elastic Compute Cloud

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 Amazon 上監控 Elastic Fabric Adapter EC2

您可以使用下列功能來監控 Elastic Fabric Adapter 的效能。

EFA Amazon EC2執行個體的驅動程式指標

Elastic Fabric Adapter (EFA) 驅動程式會從已連接EFA介面的執行個體發佈多個指標。您可以使用這些指標來疑難排解應用程式效能問題、為工作負載選擇正確的叢集大小、主動規劃擴展活動,以及對應用程式進行基準測試,以判斷它們是否將執行個體上可用的EFA效能最大化。

可用的EFA驅動程式指標

EFA 驅動程式會即時將下列指標發佈至執行個體。它們提供自執行個體啟動或上次驅動程式重設以來連接EFA裝置傳送、接收或捨棄的累計錯誤和封包或位元組數量。

指標 描述
tx_bytes

傳輸的位元組數。

單位:位元組

rx_bytes

收到的位元組數。

單位:位元組

tx_pkts

傳輸的封包數量。

單位:計數

rx_pkts

收到的封包數量。

單位:計數

rx_drops

收到然後捨棄的封包數量。

單位:計數

send_bytes

使用傳送操作傳送的位元組數。

單位:位元組

recv_bytes

傳送操作收到的位元組數。

單位:位元組

send_wrs

使用傳送操作傳送的封包數量。

單位:計數

recv_wrs

傳送操作收到的封包數量。

單位:計數

rdma_write_wrs

已完成的 rdma 寫入操作數目。

單位:計數

rdma_read_wrs

已完成的 rdma 讀取操作數目。

單位:計數

rdma_write_bytes

其他執行個體使用 rdma 寫入操作寫入至它的位元組數。

單位:位元組

rdma_read_bytes

使用 rdma 讀取操作接收的位元組數。

單位:位元組

rdma_write_wr_err

發生本機或遠端錯誤的 rdma 寫入操作數目。

單位:計數

rdma_read_wr_err

發生本機或遠端錯誤的 rdma 讀取操作數目。

單位:計數

rdma_read_resp_bytes

回應 rdma 讀取操作而傳送的位元組數。

單位:位元組

rdma_write_recv_bytes

rdma 寫入操作收到的位元組數。

單位:位元組

擷取執行個體的EFA驅動程式指標

您可以使用 rdma-tool 命令列工具來擷取連接至執行個體之所有EFA介面的指標,如下所示:

$ rdma -p statistic show link rdmap0s31/1 tx_bytes 0 tx_pkts 0 rx_bytes 0 rx_pkts 0 rx_drops 0 send_bytes 0 send_wrs 0 recv_bytes 0 recv_wrs 0 rdma_read_wrs 0 rdma_read_bytes 0 rdma_read_wr_err 0 rdma_read_resp_bytes 0 rdma_write_wrs 0 rdma_write_bytes 0 rdma_write_wr_err 0

或者,您可以使用下列命令,從 sys 檔案擷取連接至執行個體的每個EFA介面的指標。

$ more /sys/class/infiniband/device_number/ports/port_number/hw_counters/* | cat

例如

$ more /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/* | cat :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/lifespan :::::::::::::: 12 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_resp_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_drops :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_pkts :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_pkts :::::::::::::: 0

Amazon VPC流程日誌

您可以建立 Amazon VPC Flow Log,以擷取進出 之流量的相關資訊EFA。流程日誌資料可以發佈至 Amazon CloudWatch Logs 和 Amazon S3。建立流量日誌之後,您可以在選擇的目標中擷取及檢視其資料。如需詳細資訊,請參閱 Amazon VPC使用者指南 中的VPC流程日誌

您可以建立 的流程日誌,方法與建立彈性網路介面的流程日誌EFA相同。如需詳細資訊,請參閱 Amazon VPC使用者指南 中的建立流程日誌

在流程日誌項目中,EFA流量由 srcAddress和 識別destAddress,兩者都格式化為MAC地址,如下列範例所示。

version accountId eniId srcAddress destAddress sourcePort destPort protocol packets bytes start end action log-status 2 3794735123 eni-10000001 01:23:45:67:89:ab 05:23:45:67:89:ab - - - 9 5689 1521232534 1524512343 ACCEPT OK

Amazon CloudWatch

如果您在 Amazon EKS叢集EFA中使用 ,您可以使用 EFAs Container Insights 監控您的 CloudWatch 。如需詳細資訊,請參閱 Amazon 使用者指南 中的 Amazon EKS和 Kubernetes Container Insights 指標 CloudWatch