在 Amazon EC2 上監控彈性布料轉接器 - Amazon Elastic Compute Cloud

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 Amazon EC2 上監控彈性布料轉接器

您可以使用下列功能來監控 Elastic Fabric Adapter 的效能。

Amazon EC2 執行個體的 EFA 驅動程式指標

Elastic Fabric Adapter (EFA) 驅動程式會從已連接 EFA 介面的執行個體即時發佈多個指標。您可以使用這些指標對應用程式效能和聯網問題進行故障診斷、為工作負載選擇正確的叢集大小、主動規劃擴展活動,以及對應用程式進行基準測試,以判斷它們是否最大化執行個體上可用的 EFA 效能。

可用的 EFA 驅動程式指標

ENA 驅動程式會即時將下列指標交付至執行個體。它們提供從執行個體啟動或上次驅動程式重設以來,連接的 EFA 裝置所傳送、接收、重新傳輸或捨棄的錯誤、連線事件和封包或位元組的累積數量。

指標 描述 支援的執行個體類型
tx_bytes

已傳輸的位元組數目。

單位:位元組

支援 EFA 的所有執行個體類型
rx_bytes

接收的位元組數量。

單位:位元組

支援 EFA 的所有執行個體類型
tx_pkts

代理程式傳輸的封包數目。

單位:計數

支援 EFA 的所有執行個體類型
rx_pkts

接收的封包數量。

單位:計數

支援 EFA 的所有執行個體類型
rx_drops

收到然後捨棄的封包數量。

單位:計數

支援 EFA 的所有執行個體類型
send_bytes

使用傳送操作傳送的位元組數。

單位:位元組

支援 EFA 的所有執行個體類型
recv_bytes

傳送操作收到的位元組數。

單位:位元組

支援 EFA 的所有執行個體類型
send_wrs

使用傳送操作傳送的封包數量。

單位:計數

支援 EFA 的所有執行個體類型
recv_wrs

傳送操作收到的封包數量。

單位:計數

支援 EFA 的所有執行個體類型
rdma_write_wrs

已完成的 rdma 寫入操作數目。

單位:計數

支援 EFA 的所有執行個體類型
rdma_read_wrs

已完成的 rdma 讀取操作數目。

單位:計數

支援 EFA 的所有執行個體類型
rdma_write_bytes

其他執行個體使用 rdma 寫入操作寫入其中的位元組數。

單位:位元組

支援 EFA 的所有執行個體類型
rdma_read_bytes

使用 rdma 讀取操作收到的位元組數。

單位:位元組

支援 EFA 的所有執行個體類型
rdma_write_wr_err

發生本機或遠端錯誤的 rdma 寫入操作數目。

單位:計數

支援 EFA 的所有執行個體類型
rdma_read_wr_err

發生本機或遠端錯誤的 rdma 讀取操作數目。

單位:計數

支援 EFA 的所有執行個體類型
rdma_read_resp_bytes

回應 rdma 讀取操作而傳送的位元組數。

單位:位元組

支援 EFA 的所有執行個體類型
rdma_write_recv_bytes

rdma 寫入操作收到的位元組數。

單位:位元組

支援 EFA 的所有執行個體類型
retrans_bytes

重新傳輸的 EFA SRD 位元組數。

單位:計數

支援 EFA 的 Nitro v4 和更新版本的執行個體類型
retrans_pkts

重新傳輸的 EFA SRD 封包數目。

單位:位元組

支援 EFA 的 Nitro v4 和更新版本的執行個體類型
retrans_timeout_events

EFA SRD 流量逾時並導致網路路徑變更的次數。

單位:計數

支援 EFA 的 Nitro v4 和更新版本的執行個體類型
impaired_remote_conn_events

EFA SRD 連線進入受損狀態的次數,導致輸送量速率限制降低。

單位:計數

支援 EFA 的 Nitro v4 和更新版本的執行個體類型
unresponsive_remote_events

EFA SRD 遠端連線沒有回應的次數。

單位:計數

支援 EFA 的 Nitro v4 和更新版本的執行個體類型

如需支援 EFA 之執行個體類型的詳細資訊,請參閱 支援的執行個體類型

擷取執行個體的 EFA 驅動程式指標

您可以使用 rdma-tool 命令列工具來擷取連接至執行個體之所有 EFA 介面的指標,如下所示:

$ rdma -p statistic show link rdmap0s31/1 tx_bytes 0 tx_pkts 0 rx_bytes 0 rx_pkts 0 rx_drops 0 send_bytes 0 send_wrs 0 recv_bytes 0 recv_wrs 0 rdma_read_wrs 0 rdma_read_bytes 0 rdma_read_wr_err 0 rdma_read_resp_bytes 0 rdma_write_wrs 0 rdma_write_bytes 0 rdma_write_wr_err 0 retrans_bytes 0 retrans_pkts 0 retrans_timeout_events 0 unresponsive_remote_events 0 impaired_remote_conn_events 0

或者,您可以使用下列命令,從 sys 檔案擷取連接至執行個體之每個 EFA 介面的指標。

$ more /sys/class/infiniband/device_number/ports/port_number/hw_counters/* | cat

例如

$ more /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/* | cat :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/lifespan :::::::::::::: 12 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_resp_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_read_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wr_err :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rdma_write_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/recv_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_drops :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/rx_pkts :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/send_wrs :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_bytes :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/tx_pkts :::::::::::::: 0 :::::::::::::: /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_bytes :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_pkts :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/retrans_timeout_events :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/unresponsive_remote_events :::::::::::::: 0 /sys/class/infiniband/rdmap0s31/ports/1/hw_counters/impaired_remote_conn_events :::::::::::::: 0

Amazon VPC 流程日誌

您可以建立 Amazon VPC 流程日誌,以擷取進出 EFA 的流量的相關資訊。現在流程日誌資料可發佈至 Amazon CloudWatch Logs 與 Amazon S3。建立流量日誌之後,您可以在選擇的目的地中擷取及檢視其資料。如需詳細資訊,請參閱「Amazon VPC 使用者指南」中的 VPC 流程日誌

就像為彈性網絡介面建立流程日誌,您以同樣的方式為 EFA 建立流程日誌。如需詳細資訊,請參閱「Amazon VPC 使用者指南」中的建立流量日誌

在流程日誌項目中,EFA 流量是以 srcAddressdestAddress 來識別,兩者的格式都是 MAC 地址,如下列範例所示。

version accountId eniId srcAddress destAddress sourcePort destPort protocol packets bytes start end action log-status 2 3794735123 eni-10000001 01:23:45:67:89:ab 05:23:45:67:89:ab - - - 9 5689 1521232534 1524512343 ACCEPT OK

Amazon CloudWatch

如果您在 Amazon EKS 叢集中使用 EFA,您可以使用 CloudWatch Container Insights 監控 EFAs。Amazon CloudWatch Container Insights 支援所有 EFA 驅動程式指標,但 retrans_bytesretrans_pktsunresponsive_remote_eventsretrans_timeout_events和 除外impaired_remote_conn_events

如需詳細資訊,請參閱「Amazon CloudWatch 使用者指南」中的 Amazon ECS Container Insights 指標