前提条件 ElastiCache (Redis OSS) Auto Scaling によるキャパシティの自動管理 ElastiCache (Redis OSS) Auto Scaling に必要な IAM アクセス許可サービスリンクロール Auto Scaling のベストプラクティス

Auto Scaling ElastiCache (Redis OSS) クラスター

前提条件

ElastiCache (Redis OSS) Auto Scaling は、次の制限があります。

Redis OSS エンジンバージョン 6.0 以降を実行している Redis OSS (クラスターモードが有効) クラスター
Redis OSS エンジンバージョン 7.0.7 以降を実行しているデータ階層化 (クラスターモードが有効) クラスター
インスタンスサイズ - Large、XLarge、2XLarge
インスタンスタイプファミリー – R7g、R6g、R6gd、R5、M7g、M6g、M5、C7gn
ElastiCache (Redis OSS) の Auto Scaling は、グローバルデータストア、Outposts、またはローカルゾーンで実行されているクラスターではサポートされていません。

ElastiCache (Redis OSS) Auto Scaling によるキャパシティの自動管理

ElastiCache (Redis OSS) Auto Scaling は、 ElastiCache (Redis OSS) サービスで必要なシャードまたはレプリカを自動的に増減する機能です。 ElastiCache （Redis OSS) は Application Auto Scaling サービスを活用してこの機能を提供します。詳細については、Application Auto Scaling を参照してください。自動スケーリングを使用するには、割り当てた CloudWatch メトリクスとターゲット値を使用するスケーリングポリシーを定義して適用します。 ElastiCache （Redis OSS) Auto Scaling は、ポリシーを使用して、実際のワークロードに応じてインスタンスの数を増減します。

を使用して、事前定義されたメトリクスに基づいてスケーリングポリシー AWS Management Console を適用できます。predefined metric は列挙型で定義されるため、それをコード内に名前で指定するか、 AWS Management Consoleで使用できます。カスタムのメトリクスは、 AWS Management Consoleを使用した選択には使用できません。または、 AWS CLI または Application Auto Scaling API を使用して、事前定義されたメトリクスまたはカスタムメトリクスに基づいてスケーリングポリシーを適用することもできます。

ElastiCache (Redis OSS) は、次のディメンションのスケーリングをサポートしています。

[シャード] — 手動オンラインリシャーディングと同様に、クラスター内のシャードを自動的に追加/削除します。この場合、 ElastiCache (Redis OSS) 自動スケーリングはユーザーに代わってスケーリングをトリガーします。
[レプリカ] – 手動によるレプリカの増加/減少オペレーションと同様に、クラスター内のレプリカを自動的に追加/削除します。 ElastiCache (Redis OSS) 自動スケーリングは、クラスター内のすべてのシャードでレプリカを均一に追加/削除します。

ElastiCache (Redis OSS) では、次のタイプの自動スケーリングポリシーがサポートされています。

ターゲット追跡スケーリングポリシー – 特定のメトリクスのターゲット値に基づいて、サービスが実行するシャード/レプリカの数を増減させます。これはサーモスタットが家の温度を維持する方法に似ています。温度を選択すれば、後はサーモスタットがすべてを実行します。
アプリケーション ElastiCache (Redis OSS) 自動スケーリングのスケジュールされたスケーリング – 日付と時刻に基づいてサービスが実行するシャード/レプリカの数を増減します。

次のステップは、前の図に示すように ElastiCache (Redis OSS) 自動スケーリングプロセスをまとめたものです。

ElastiCache (Redis OSS) レプリケーショングループの ElastiCache (Redis OSS) 自動スケーリングポリシーを作成します。
ElastiCache (Redis OSS) Auto Scaling は、ユーザーに代わって CloudWatch アラームのペアを作成します。各ペアはメトリクスの上限と下限を示します。これらの CloudWatch アラームは、クラスターの実際の使用率が目標使用率から一定期間逸脱したときにトリガーされます。コンソールでアラームを表示できます。
設定されたメトリクス値が特定の期間にわたってターゲット使用率を超える (またはターゲットを下回る) と、は ElastiCache (Redis OSS) 自動スケーリングを呼び出してスケーリングポリシーを評価するアラームを CloudWatch トリガーします。
ElastiCache (Redis OSS) Auto Scaling は、クラスターの容量を調整するための変更リクエストを発行します。
ElastiCache (Redis OSS) は Modify リクエストを処理し、クラスターのシャード/レプリカ容量を動的に増加 (または減少) して、ターゲット使用率に近づきます。

ElastiCache (Redis OSS) Auto Scaling の仕組みを理解するために、という名前のクラスターがあるとしますUsersCluster。の CloudWatch メトリクスをモニタリングすることでUsersCluster、トラフィックがピーク時にクラスターが必要とする最大シャードと、トラフィックが最低ポイントにあるときに最小シャードを決定します。また、UsersCluster クラスターの CPU 使用率のターゲット値を決定します。 ElastiCache (Redis OSS) Auto Scaling UsersClusterは、ターゲット追跡アルゴリズムを使用して、使用率がターゲット値またはその近くにとどまるように、のプロビジョニングされたシャードが必要に応じて調整されるようにします。

注記

スケーリングにはかなりの時間がかかる場合があり、シャードの再調整には追加のクラスターリソースが必要になります。 ElastiCache （Redis OSS) Auto Scaling は、実際のワークロードが数分間にわたって増加 (または低下) した場合にのみリソース設定を変更します。 ElastiCache (Redis OSS) の Auto Scaling ターゲット追跡アルゴリズムは、長期にわたってターゲット使用率を選択した値またはその近くに維持することを目指します。

ElastiCache (Redis OSS) Auto Scaling に必要な IAM アクセス許可

ElastiCache (Redis OSS) Auto Scaling は CloudWatch、 ElastiCache (Redis OSS) と Application Auto Scaling APIs。クラスターは ElastiCache (Redis OSS) で作成および更新され、アラームはで作成され CloudWatch、スケーリングポリシーは Application Auto Scaling で作成されます。クラスターを作成および更新するための標準の IAM アクセス許可に加えて、 ElastiCache (Redis OSS) Auto Scaling 設定にアクセスする IAM ユーザーには、動的スケーリングをサポートするサービスに対する適切なアクセス許可が必要です。IAM ユーザーには、次のポリシー例に示すアクションを使用するためのアクセス許可が必要です。


{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "application-autoscaling:*",
                "elasticache:DescribeReplicationGroups",
                "elasticache:ModifyReplicationGroupShardConfiguration",
                "elasticache:IncreaseReplicaCount",
                "elasticache:DecreaseReplicaCount",
                "elasticache:DescribeCacheClusters",
                "elasticache:DescribeCacheParameters",
                "cloudwatch:DeleteAlarms",
                "cloudwatch:DescribeAlarmHistory",
                "cloudwatch:DescribeAlarms",
                "cloudwatch:DescribeAlarmsForMetric",
                "cloudwatch:GetMetricStatistics",
                "cloudwatch:ListMetrics",
                "cloudwatch:PutMetricAlarm",
                "cloudwatch:DisableAlarmActions",
                "cloudwatch:EnableAlarmActions",
                "iam:CreateServiceLinkedRole",
                "sns:CreateTopic",
                "sns:Subscribe",
                "sns:Get*",
                "sns:List*"
            ],
            "Resource": "arn:aws:iam::123456789012:role/autoscaling-roles-for-cluster"
        }
    ]
}

サービスリンクロール

ElastiCache (Redis OSS) Auto Scaling サービスには、クラスターと CloudWatch アラームを記述するアクセス許可と、ユーザーに代わって ElastiCache (Redis OSS) ターゲット容量を変更するアクセス許可も必要です。 ElastiCache (Redis OSS) クラスターで Auto Scaling を有効にすると、という名前のサービスにリンクされたロールが作成されますAWSServiceRoleForApplicationAutoScaling_ElastiCacheRG。このサービスにリンクされたロールは、ポリシーのアラームを記述し、フリートの現在の容量をモニタリングし、フリートの容量を変更するアクセス許可を ElastiCache (Redis OSS) Auto Scaling に付与します。サービスにリンクされたロールは、 ElastiCache (Redis OSS) 自動スケーリングのデフォルトロールです。詳細については、Application Auto Scaling ユーザーガイドの ElastiCache (Redis OSS) Auto Scaling のサービスにリンクされたロールを参照してください。

Auto Scaling のベストプラクティス

Auto Scaling に登録する前に、以下のことをお勧めします。

追跡メトリクスを 1 つだけ使用 — クラスターに CPU 負荷の高いワークロードまたはデータ集約型のワークロードがあるかどうかを識別し、対応する定義済みメトリックを使用してスケーリングポリシーを定義します。
- エンジン CPU: ElastiCachePrimaryEngineCPUUtilization (シャードディメンション) または ElastiCacheReplicaEngineCPUUtilization (レプリカディメンション)
- データベースの使用状況: ElastiCacheDatabaseCapacityUsageCountedForEvictPercentage このスケーリングポリシーは、クラスターで maxmemory-policy が noeviction に設定されている場合に最適です。
クラスターのディメンションごとに複数のポリシーを避けることをお勧めします。 ElastiCache （Redis OSS) Auto Scaling は、ターゲット追跡ポリシーがスケールアウトできる状態であればスケーラブルターゲットをスケールアウトしますが、すべてのターゲット追跡ポリシー (スケールイン部分が有効) がスケールインできる場合にのみスケールインします。複数のポリシーによって、スケーラブルなターゲットが同時にスケールアウトまたはスケールインするように指示される場合、Auto Scaling は、スケールインとスケールアウトの両方で最大の容量を提供するポリシーに基づいてスケールします。
ターゲット追跡のカスタマイズされたメトリクス — Target Tracking 用にカスタマイズされたメトリクスを使用する場合は注意が必要です。Auto Scaling は、ポリシー用に選択されたメトリクスの変更に比例してスケールアウトするのに最適です。スケーリングアクションに比例して変更されないメトリクスがポリシーの作成に使用されると、可用性やコストに影響する可能性のあるスケールアウトまたはスケールインアクションが継続する可能性があります。

データ階層化クラスター (r6gd ファミリーのインスタンスタイプ) では、スケーリングにメモリベースのメトリクスを使用しないでください。
スケジュールに基づくスケーリング — ワークロードが確定的 (特定の時点で高/低に達する) であることが判明した場合は、スケジュールされたスケーリングを使用し、必要に応じてターゲット容量を設定することをお勧めします。ターゲット追跡は、非決定的なワークロードや、必要なターゲットメトリクスでクラスターを操作する場合に最適です。これにより、より多くのリソースが必要な場合はスケールアウトし、必要な場合はスケールインします。
スケールインを無効化する — ターゲット追跡での Auto Scaling は、ワークロードが徐々に増減するクラスターに最適です。メトリクスのスパイク/ディップが連続するスケールアウト/イン振動を引き起こす可能性があるためです。このような振動を避けるために、スケールインを無効にして開始し、後でいつでも必要に応じて手動でスケールインすることができます。
アプリケーションをテスト — 可用性の問題を回避するために、スケーリングポリシーを作成しながら、クラスターに必要な最小/最大シャード/レプリカの絶対値を決定するために、最小/最大ワークロードを推定してアプリケーションをテストすることをお勧めします。Auto Scaling は Max にスケールアウトし、ターゲットに設定された最小しきい値にスケールインできます。
ターゲット値の定義 — 4 週間のクラスター使用率に対応する CloudWatch メトリクスを分析して、ターゲット値のしきい値を決定できます。選択する値が不明な場合は、サポートされる最小定義メトリクス値から開始することをお勧めします。
AutoScaling ターゲット追跡のは、シャード/レプリカのディメンション間でワークロードを均一に分散するクラスターに最適です。不均一な分布を持つと、次のことが可能になります。
- いくつかのホットシャード/レプリカでワークロードの急増/減少が原因で、必要のない場合のスケーリング。
- ホットシャード/レプリカがあるにもかかわらず、全体的な平均ターゲットに近いために必要なときにスケーリングされません。

注記

クラスターをスケールアウトすると、 ElastiCache は既存のノードの 1 つにロードされた関数 (ランダムに選択) を新しいノードに自動的にレプリケートします。クラスターに Redis OSS 7.0 以降があり、アプリケーションが Redis OSS Functions を使用している場合は、スケールアウトする前にすべての関数をすべてのシャードにロードして、クラスターが異なるシャードで異なる関数を消費しないようにすることをお勧めします。

に登録したら AutoScaling、次の点に注意してください。

Auto Scaling でサポートされる設定には制限があるため、Auto Scaling に登録されているレプリケーショングループの設定を変更しないことをお勧めします。次に例を示します。
- インスタンスタイプをサポートされていないタイプに手動で変更します。
- レプリケーショングループをグローバルデータストアに関連付けます。
- ReservedMemoryPercent パラメータの変更。
- ポリシーの作成時に設定された Min/Max 容量を超えるシャード/レプリカを手動で増減します。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

独自設計型クラスターの管理

Auto Scaling ポリシー