Valkey と Redis のメトリクス OSS - Amazon ElastiCache

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Valkey と Redis のメトリクス OSS

Amazon ElastiCache 名前空間には、次の Valkey メトリクスと Redis OSSメトリクスが含まれます。これらのメトリクスは、Valkey エンジンを使用する場合も同じです。

ReplicationLag と を除きEngineCPUUtilization、これらのメトリクスは info コマンドから派生します。各メトリクスは、キャッシュノードレベルで算出されます。

info コマンドの完全なドキュメントについては、http://valkey.io/commands/info を参照してください。

以下の資料も参照してください

メトリクス 説明 単位
ActiveDefragHits アクティブなデフラグメンテーションプロセスで実行された 1 分あたりの値の再割り当て数。これはactive_defrag_hits、 の統計から派生しますINFO
AuthenticationFailures AUTH コマンドOSSを使用して Valkey または Redis に対して認証に失敗した試行の合計数。ACL LOG コマンドを使用して、個々の認証の失敗に関する詳細情報を確認できます。不正アクセスの試みを検出するために、このアラームを設定することをお勧めします。 カウント
BytesUsedForCache Valkey または Redis によって、データセット、バッファなど、OSSすべての目的に割り当てられたバイトの合計数。 バイト
Dimension: Tier=Memory を使用する Valkey または Redis OSSクラスターの場合のデータ階層化 ElastiCache: メモリによるキャッシュに使用されるバイトの合計数。これは、 のused_memory統計の値ですINFO バイト
Dimension: Tier=SSD を使用する Valkey または Redis OSSクラスターの場合のデータ階層化 ElastiCache: によるキャッシュに使用されるバイトの合計数SSD。 バイト
BytesReadFromDisk ディスクから読み取られる 1 分あたりの合計バイト数です。のデータ階層化 ElastiCache を使用するクラスターのみがサポートされます。 バイト
BytesWrittenToDisk ディスクに書き込まれる 1 分あたりの合計バイト数です。のデータ階層化 ElastiCache を使用するクラスターのみがサポートされます。 バイト
CacheHits メインディクショナリで読み取り専用のキー検索に成功した数。これはkeyspace_hits、 の統計から派生しますINFO カウント
CacheMisses メインディクショナリで読み取り専用のキー検索に失敗した数。これはkeyspace_misses、 の統計から派生しますINFO カウント
CommandAuthorizationFailures ユーザーが呼び出すためのアクセス許可を持たないコマンドの実行に失敗した試行の合計数。ACL LOG コマンドを使用して、個々の認証の失敗に関する詳細情報を確認できます。不正アクセスの試みを検出するために、このアラームを設定することをお勧めします。 カウント
CacheHitRate Valkey または Redis OSSインスタンスの使用効率を示します。キャッシュ比率が約 0.8 より小さい場合、かなりの量のキーが削除された、期限切れになった、または存在しないことを意味します。これは、cache_hitscache_misses 統計を使用して、次の方法で計算されます: cache_hits /(cache_hits + cache_misses) 割合 (%)
ChannelAuthorizationFailures ユーザーがアクセス許可を持たないチャネルへのアクセスに失敗した試行の合計数。ACL LOG コマンドを使用して、個々の認証の失敗に関する詳細情報を確認できます。不正アクセスの試みを検出するために、このメトリクスにアラームを設定することをお勧めします。 カウント
CurrConnections read replicas. からの接続を除くクライアント接続の数は、2 つから 4 つの接続 ElastiCache を使用して、各ケースでクラスターをモニタリングします。これは、 connected_clients の統計から派生しますINFO カウント
CurrItems キャッシュの項目数。これはkeyspace統計から派生し、キースペース全体のすべてのキーを合計します。 カウント
のデータ階層化 ElastiCache を使用するクラスターの Dimension: Tier=Memory です。メモリ内の項目の数です。 カウント
のデータ階層化 ElastiCache を使用するクラスターの Dimension: Tier=SSD (ソリッドステートドライブ) です。内の項目の数SSD。 カウント
CurrVolatileItems TTL が設定されているすべてのデータベース内のキーの総数。これはexpires統計から導き出され、すべてのキーをキースペース全体に設定された ttl で合計します。 カウント
DatabaseCapacityUsagePercentage

使用中のクラスターの総データ容量の割合。

Data Tiered インスタンスでは、メトリクスは として計算され(used_memory - mem_not_counted_for_evict + SSD used) / (maxmemory + SSD total capacity)used_memorymaxmemoryは から取得されますINFO

それ以外の場合、メトリクスは を使用して計算されますused_memory/maxmemory

割合 (%)
DatabaseCapacityUsageCountedForEvictPercentage

オーバーヘッドと に使用されるメモリを除く、使用中のクラスターの合計データ容量の割合COB。このメトリクスは次のように計算されます。

used_memory - mem_not_counted_for_evict/maxmemory

データ階層化インスタンスでは、メトリクスは次のように計算されます。

(used_memory + SSD used) / (maxmemory + SSD total capacity)

used_memory および maxmemoryが取得される場所 INFO

割合 (%)
DatabaseMemoryUsagePercentage 使用中のクラスターのメモリの割合。これは、 used_memory/maxmemoryから を使用して計算されますINFO 割合 (%)
DatabaseMemoryUsageCountedForEvictPercentage オーバーヘッドと に使用されるメモリを除く、使用中のクラスターのメモリの割合COB。これは、 used_memory-mem_not_counted_for_evict/maxmemoryから を使用して計算されますINFO 割合 (%)
DB0AverageTTL INFO コマンドの統計avg_ttlDBOから keyspace を公開します。レプリカはキーを失効させず、プライマリノードがキーを失効させるまで待機します。プライマリノードがキーを期限切れにする (または のためにキーを削除するLRU) と、 DEL コマンドが合成され、すべてのレプリカに送信されます。したがって、レプリカノードの DB0AverageTTL は 0 です。これは、キーの有効期限が切れていないため、 を追跡しないためですTTL。 ミリ秒
EngineCPUUtilization

Valkey または Redis OSS エンジンスレッドのCPU使用率を提供します。Valkey と Redis OSSはシングルスレッドであるため、このメトリクスを使用してプロセス自体の負荷を分析できます。EngineCPUUtilization メトリクスは、プロセスのより正確な可視性を提供します。CPUUtilization メトリクスと組み合わせて使用できます。 は、他のオペレーティングシステムや管理プロセスなど、サーバーインスタンス全体のCPU使用率をCPUUtilization公開します。4 vCPUs つ以上の大規模なノードタイプでは、EngineCPUUtilizationメトリクスを使用してスケーリングのしきい値をモニタリングおよび設定します。

注記

ElastiCache ホストでは、バックグラウンドプロセスがホストをモニタリングして、マネージドデータベースエクスペリエンスを提供します。これらのバックグラウンドプロセスは、CPUワークロードの大部分を占める可能性があります。これは、 が 3 つを超える大規模なホストでは重要ではありませんvCPUs。ただし、2 vCPUs 以下の小さいホストに影響する可能性があります。EngineCPUUtilization メトリクスのみをモニタリングする場合、ホストが Valkey または Redis からの使用率が高くOSS、バックグラウンドモニタリングプロセスCPUからのCPU使用率が高いという状況に気付かないでしょう。したがって、2 vCPUsつ以下のホストのCPUUtilizationメトリクスをモニタリングすることをお勧めします。

割合 (%)
Evictions maxmemory の制限のため排除されたキーの数。これはevicted_keys、 の統計から派生しますINFO カウント
GlobalDatastoreReplicationLag これは、セカンダリリージョンのプライマリノードとプライマリリージョンのプライマリノード間の遅延です。クラスターモードが有効になっている Valkey または Redis の場合OSS、遅延はシャード間の最大遅延を示します。 [秒]
IamAuthenticationExpirations 期限切れのIAM認証済み Valkey または Redis OSS接続の合計数。IAM による認証 の詳細については、ユーザーガイドで確認できます。 カウント
IamAuthenticationThrottling スロットリングされたIAM認証済み Valkey または Redis OSSAUTHまたはHELLOリクエストの総数。IAM による認証 の詳細については、ユーザーガイドで確認できます。 カウント
IsMaster ノードが現在のシャード/クラスタのプライマリノードかどうかを示します。メトリクスは 0 (プライマリではない) または 1 (プライマリ) にすることができます。 カウント
KeyAuthorizationFailures ユーザーがアクセス許可を持たないキーへのアクセスに失敗した試行の合計数。ACL LOG コマンドを使用して、個々の認証の失敗に関する詳細情報を確認できます。不正アクセスの試みを検出するために、このアラームを設定することをお勧めします。 カウント
KeysTracked Valkey または Redis キー追跡によって追跡されるOSSキーの数を、 の割合で示しますtracking-table-max-keys。キーラッキングは、クライアント側のキャッシュを支援するために使用され、キーが変更されたときにクライアントに通知します。 カウント
MemoryFragmentationRatio Valkey または Redis OSS エンジンのメモリ割り当ての効率を示します。特定のしきい値は、異なる動作を意味します。推奨値は、1.0 を超える断片化です。これは、 mem_fragmentation_ratio statisticの から計算されますINFO
NewConnections この期間内にサーバーによって受け入れられた接続の総数。これは、 total_connections_received の統計から派生しますINFO
注記

ElastiCache (Redis OSS) バージョン 5 以前を使用している場合、このメトリクスによって報告された接続のうち 2 つから 4 つが ElastiCache によってクラスターのモニタリングに使用されます。ただし、 ElastiCache (Redis OSS) バージョン 6 以降を使用する場合、クラスターのモニタリング ElastiCache に が使用する接続はこのメトリクスに含まれません。

カウント
NumItemsReadFromDisk ディスクから取得される 1 分あたりの項目の総数です。のデータ階層化 ElastiCache を使用するクラスターのみがサポートされます。 カウント
NumItemsWrittenToDisk ディスクに書き込まれる 1 分あたりの項目の総数です。のデータ階層化 ElastiCache を使用するクラスターのみがサポートされます。 カウント
MasterLinkHealthStatus このステータスの値は、0 または 1 のいずれかになります。値 0 は、プライマリノードの ElastiCacheデータが OSSの Valkey または Redis と同期していないことを示しますEC2。値 1 は、データが同期されていることを示します。移行を完了するには、 CompleteMigrationAPIオペレーションを使用します。 ブール値
Reclaimed キーの有効期限切れイベントの総数。これは、 expired_keys の統計から派生しますINFO カウント
ReplicationBytes レプリケートされたノードについては、ReplicationBytes は、プライマリがすべてのレプリカに対して送信するバイト数を報告します。このメトリクスは、レプリケーショングループに対する書き込み負荷を表します。これはmaster_repl_offset、 の統計から派生しますINFO バイト
ReplicationLag このメトリクスは、リードレプリカとして実行中のノードにのみ適用できます。レプリカのプライマリノードからの変更適用の進行状況を秒で表します。Valkey 7.2 以降、および Redis OSS エンジンバージョン 5.0.6 以降では、遅延をミリ秒単位で測定できます。 [秒]
SaveInProgress このバイナリメトリクスは、バックグラウンド保存 (分岐または分岐なし) が進行中の場合は常に 1 を返し、それ以外の場合は 0 を返します。バックグラウンド保存プロセスは一般に、スナップショットおよび同期の際に使用されます。これらのオペレーションによりパフォーマンスが低下する可能性があります。SaveInProgress メトリクスを使用して、パフォーマンスが低下した原因がバックグラウンド保存プロセスであるかどうかを診断できます。これはrdb_bgsave_in_progress、 の統計から派生しますINFO ブール値
TrafficManagementActive ElastiCache (Redis OSS) が受信コマンド、モニタリング、またはレプリケーションに割り当てられたトラフィックを調整して、トラフィックを積極的に管理しているかどうかを示します。トラフィックは、Valkey または Redis が処理できるコマンドよりも多くのコマンドがノードに送信されると管理OSSされ、エンジンの安定性と最適なオペレーションを維持するために使用されます。データポイントが 1 の場合は、提供されているワークロードに対してノードが過小評価されていることを示している可能性があります。
注記

この指標が引き続き有効な場合は、クラスターを評価してスケールアップとスケールアウトのどちらが必要かを判断します。関連するメトリクスには、NetworkBandwidthOutAllowanceExceeded および EngineCPUUtilization が含まれます。

ブール値
E ngineCPUUtilization の可用性

AWS 以下にリストされているリージョンは、サポートされているすべてのノードタイプで使用できます。

リージョン リージョン名
us-east-2 米国東部(オハイオ)
us-east-1 米国東部 (バージニア北部)
us-west-1 米国西部 (北カリフォルニア)
us-west-2 米国西部 (オレゴン)
ap-northeast-1 アジアパシフィック (東京)
ap-northeast-2 アジアパシフィック (ソウル)
ap-northeast-3 アジアパシフィック (大阪)
ap-east-1 アジアパシフィック (香港)
ap-south-1 アジアパシフィック (ムンバイ)
ap-southeast-1 アジアパシフィック (シンガポール)
ap-southeast-2 アジアパシフィック (シドニー)
ap-southeast-3 アジアパシフィック (ジャカルタ)
ca-central-1 カナダ (中部)
cn-north-1 中国 (北京)
cn-northwest-2 中国 (寧夏)
me-south-1 中東 (バーレーン)
eu-central-1 欧州 (フランクフルト)
eu-west-1 欧州 (アイルランド)
eu-west-2 欧州 (ロンドン)
eu-west-3 欧州(パリ)
eu-south-1 欧州 (ミラノ)
af-south-1 アフリカ (ケープタウン)
eu-north-1 欧州 (ストックホルム)
sa-east-1 南米 (サンパウロ)
us-gov-west-1 AWS GovCloud (米国西部)
us-gov-east-1 AWS GovCloud (米国東部)

以下は特定の種類のコマンドの集計で、info commandstats から算出されています。コマンド統計セクションには、呼び出しの数、これらのコマンドが消費した合計CPU時間、コマンド実行あたりの平均CPU消費時間など、コマンドタイプに基づく統計が表示されます。コマンドタイプごとに、次の行が追加されます: cmdstat_XXX: calls=XXX,usec=XXX,usec_per_call=XXX

次に示すレイテンシーメトリクスは、 のコマンド統計を使用して計算されますINFO。それらは次のように計算されます: delta(usec)/delta(calls)delta は、1 分以内の差分として計算されます。レイテンシーは、 コマンドの処理 ElastiCache に がかかったCPU時間として定義されます。データ階層化を使用するクラスターの場合、 から項目を取得するのにかかる時間はこれらの測定値に含まれSSDないことに注意してください。

使用可能なコマンドの完全なリストについては、「Valkey ドキュメント」の「 コマンド」を参照してください。

メトリクス 説明 単位
ClusterBasedCmds クラスターベースのコマンドの総数。これは、クラスター (cluster slotcluster infoなど) で動作するすべてのコマンドを合計することでcommandstats統計から導き出されます。 カウント
ClusterBasedCmdsLatency クラスターベースのコマンドのレイテンシー。 マイクロ秒
EvalBasedCmds eval ベースのコマンドの合計数。これはcommandstatseval、 を合計して統計から派生しますevalsha カウント
EvalBasedCmdsLatency Eval ベースのコマンドのレイテンシー。 マイクロ秒
GeoSpatialBasedCmds 地理空間ベースのコマンドの総数。これはcommandstats統計から派生します。これは、すべての geo の種類のコマンド (geoaddgeodistgeohashgeoposgeoradius、および georadiusbymember) を合計することによって算出されます。 カウント
GeoSpatialBasedCmdsLatency 地理空間ベースのコマンドのレイテンシー。 マイクロ秒
GetTypeCmds read-only 型のコマンドの合計数。これは、すべてのread-only型コマンド (gethget、、 lrangeなど) scardを合計してcommandstats統計から派生します。 カウント
GetTypeCmdsLatency 読み取りコマンドのレイテンシー。 マイクロ秒
HashBasedCmds ハッシュベースのコマンドの総数。これは、1 つ以上のハッシュ (hgethkeys、、 hdelなど) hvalsで動作するすべてのコマンドを合計することでcommandstats統計から派生します。 カウント
HashBasedCmdsLatency ハッシュベースのコマンドのレイテンシー。 マイクロ秒
HyperLogLogBasedCmds HyperLogLog ベースのコマンドの合計数。これは、すべてのpfタイプのコマンド (pfaddpfcountpfmergeなど) を合計してcommandstats統計から派生します。 カウント
HyperLogLogBasedCmdsLatency HyperLogLogベースのコマンドのレイテンシー。 マイクロ秒
JsonBasedCmds 読み取りJSONコマンドと書き込みコマンドの両方を含むコマンドの合計数。これは、JSONキーで動作するすべてのJSONコマンドを合計することでcommandstats統計から導き出されます。 カウント
JsonBasedCmdsLatency 読み取りJSONコマンドと書き込みコマンドの両方を含む、すべてのコマンドのレイテンシー。 マイクロ秒
JsonBasedGetCmds JSON 読み取り専用コマンドの合計数。これは、JSONキーで動作するすべてのJSON読み取りコマンドを合計することでcommandstats統計から導き出されます。 カウント
JsonBasedGetCmdsLatency JSON 読み取り専用コマンドのレイテンシー。 マイクロ秒
JsonBasedSetCmds JSON 書き込みコマンドの合計数。これは、JSONキーで動作するすべてのJSON書き込みコマンドを合計することでcommandstats統計から導き出されます。 カウント
JsonBasedSetCmdsLatency JSON 書き込みコマンドのレイテンシー。 マイクロ秒
KeyBasedCmds キーベースのコマンドの総数。これは、複数のデータ構造 (del、、 expire renameなど) にわたって 1 つ以上のキーで動作するすべてのコマンドを合計することで、commandstats統計から派生します。 カウント
KeyBasedCmdsLatency キーベースのコマンドのレイテンシー。 マイクロ秒
ListBasedCmds リストベースのコマンドの総数。これは、1 つ以上のリスト (lindexlrange、、 ltrimなど) に基づいて動作するすべてのコマンドを合計することでlpushcommandstats統計から派生します。 カウント
ListBasedCmdsLatency リストベースのコマンドのレイテンシー。 マイクロ秒
NonKeyTypeCmds キーベースではないコマンドの合計数。これは、 acldbsizeや など、キーに作用しないすべてのコマンドを合計することでcommandstats統計から導き出されますinfo カウント
NonKeyTypeCmdsLatency コマンドの non-key-basedレイテンシー。 マイクロ秒
PubSubBasedCmds pub/sub 機能のコマンドの総数。これは、pub/sub 機能に使用されるすべてのコマンド、psubscribe、、publish、、pubsubpunsubscribessubscribesunsubscribespublishsubscribe、および を合計してcommandstats統計から派生しますunsubscribe カウント
PubSubBasedCmdsLatency PubSubBased コマンドのレイテンシー。 マイクロ秒
SetBasedCmds セットベースのコマンドの総数。これは、1 つ以上のセット (scardsdiff、、 sunionなど) で動作するすべてのコマンドを合計commandstatsすることでsadd統計から派生します。 カウント
SetBasedCmdsLatency セットベースのコマンドのレイテンシー。 マイクロ秒
SetTypeCmds write 型のコマンドの合計数。これは、データ (set、、hsetsadd lpopなど) で動作するすべてのmutativeタイプのコマンドを合計することで、commandstats統計から導き出されます。 カウント
SetTypeCmdsLatency 書き込みコマンドのレイテンシー。 マイクロ秒
SortedSetBasedCmds ソートされたセットベースのコマンドの総数。これは、1 つ以上のソートされたセット (zcountzrangezadd、 など) で動作するすべてのコマンドを合計commandstatsすることでzrank統計から派生します。 カウント
SortedSetBasedCmdsLatency ソートベースのコマンドのレイテンシー。 マイクロ秒
StringBasedCmds 文字列ベースのコマンドの総数。これは、1 つ以上の文字列 (strlensetexsetrangeなど) に作用するすべてのコマンドを合計することでcommandstats統計から導き出されます。 カウント
StringBasedCmdsLatency 文字列ベースのコマンドのレイテンシー。 マイクロ秒
StreamBasedCmds ストリームベースのコマンドの総数。これは、1 つ以上のストリームデータ型 (xrangexlenxaddxdelなど) に作用するすべてのコマンドを合計することでcommandstats統計から導き出されます。 カウント
StreamBasedCmdsLatency ストリームベースのコマンドのレイテンシー。 マイクロ秒