Storage Gateway のモニタリング - AWS Storage Gateway

Storage Gateway のモニタリング

このセクションでは、Amazon CloudWatch を使用してゲートウェイをモニタリングする方法について説明します。これには、ゲートウェイに関連付けられているリソースのモニタリングが含まれます。ゲートウェイのアップロードバッファとキャッシュストレージをモニタリングできます。AWS Storage Gateway コンソールを使用してゲートウェイのメトリクスとアラームを表示します。たとえば、読み取り/書き込みオペレーションで使用されたバイト数、読み取り/書き込みオペレーションにかかった時間、および AWS クラウドからデータを取得するためにかかった時間を表示できます。メトリックスを使用することにより、ゲートウェイの状態を追跡して、1 つ以上のメトリックスが定義されているしきい値を超えると通知を受け取るようにアラームをセットアップできます。

Storage Gateway は CloudWatch メトリクスを追加料金なしで提供します。Storage Gateway メトリクスは 2 週間の間、記録されます。これらのメトリクスを使用することにより、履歴情報にアクセスして、ゲートウェイとボリュームのパフォーマンスをより的確に把握できます。Storage Gateway では、CloudWatch アラーム (高解像度のアラームを除く) も無償で提供されます。CloudWatch の料金の詳細については、「Amazon CloudWatch の料金」を参照してください。CloudWatch の詳細については、Amazon CloudWatch ユーザーガイドを参照してください。

ゲートウェイメトリクスについて

ここでは、ゲートウェイに限定した (ゲートウェイに関する測定を行う) メトリクスとして gateway メトリクスを定義します。ゲートウェイには 1 つ以上のボリュームが含まれているので、ゲートウェイ固有のメトリクスは、ゲートウェイにあるすべてのボリュームの代表です。たとえば、CloudBytesUploaded メトリクスは、レポート期間中にゲートウェイがクラウドに送信した総バイト数です。このメトリクスには、ゲートウェイのすべてのボリュームのアクティビティが含まれます。

ゲートウェイメトリクスデータを使用するとき、メトリクスを表示するゲートウェイの一意の ID を指定します。これを行うには、GatewayId 値と GatewayName 値の両方を指定します。ゲートウェイのメトリクスを使用する場合は、メトリクスの名前空間でゲートウェイのディメンションを指定して、ゲートウェイ固有のメトリクスをボリューム固有のメトリクスと区別します。詳細については、「Amazon CloudWatch メトリクスの使用」を参照してください。

メトリクス 説明 適用先
AvailabilityNotifications

ゲートウェイによって生成された可用性関連のヘルス通知の数。

このメトリクスを Sum 統計とともに使用して、ゲートウェイで可用性関連のイベントが発生しているかどうかを調べます。イベントの詳細については、設定されている CloudWatch ロググループを確認してください。

単位: 数値

すべてのゲートウェイ。

CacheHitPercent

キャッシュから提供されたアプリケーション読み取りの割合。サンプリングは、レポート期間の最後に行われます。

単位: パーセント

ファイル、キャッシュ型ボリューム、およびテープゲートウェイ。

CacheUsed

ゲートウェイのキャッシュストレージで使用されている総バイト数。サンプリングは、レポート期間の最後に行われます。

単位: バイト

ファイル、キャッシュ型ボリューム、およびテープゲートウェイ。

IndexEvictions

新しいエントリ用にスペースを確保するために、ファイルメタデータのキャッシュされたインデックスからメタデータが削除されたファイルの数。ゲートウェイは、AWS クラウドからオンデマンドで入力されるこのメタデータインデックスを維持します。

統計: SampleCount はディレクトリ数、SUM は合計ファイル数、Average はディレクトリあたりの平均ファイル数です。

単位: 数値

ファイルゲートウェイのみ。

IndexFetches

メタデータがフェッチされたファイルの数。ゲートウェイは、AWS クラウドからオンデマンドで入力されるファイルメタデータのキャッシュされたインデックスを維持します。

統計: SampleCount はディレクトリ数、SUM は合計ファイル数、Average はディレクトリあたりの平均ファイル数です。

単位: 数値

ファイルゲートウェイのみ。

IoWaitPercent

ゲートウェイがローカルディスクからの応答を待機している時間の割合。

単位: パーセント

すべてのゲートウェイ。

MemTotalBytes

ゲートウェイ VM にプロビジョニングされた RAM の量 (バイト単位)。

単位: バイト

すべてのゲートウェイ。

MemUsedBytes

ゲートウェイ VM で現在使用されている RAM の量 (バイト単位)。

単位: バイト

すべてのゲートウェイ。

QueuedWrites

ゲートウェイにあるすべてのボリュームを対象としたレポートの期間の終わりの時点でサンプリングされた、AWS への書き込みを待機しているバイト数。このバイト数はゲートウェイの作業ストレージに保存されます。

単位: バイト

すべてのゲートウェイ。

ReadBytes

ゲートウェイにあるすべてのボリュームを対象としたレポートの期間中に内部設置型のアプリケーションから読み取られた総バイト数。

このメトリクスを Sum 統計と共に使用してスループットを測定し、Samples 統計と共に使用して IOPS を測定します。

単位: バイト

ファイル、キャッシュ型ボリューム、およびストアドボリュームゲートウェイ。

ReadTime

ゲートウェイにあるすべてのボリュームを対象としたレポートの期間中にオンプレミスのアプリケーションからの読み込みオペレーションにかかった合計時間 (ミリ秒)。

このメトリクスを Average 統計と共に使用してレイテンシーを測定します。

単位: ミリ秒

ファイル、キャッシュ型ボリューム、およびストアドボリュームゲートウェイ。

SmbV1Sessions

ゲートウェイでアクティブなサーバーメッセージブロック (SMB) バージョン 1 セッションの数。

単位: 数値

ファイルゲートウェイのみ。

SmbV2Sessions

ゲートウェイでアクティブな SMB バージョン 2 セッションの数。

単位: 数値

ファイルゲートウェイのみ。

SmbV3Sessions

ゲートウェイでアクティブな SMB バージョン 3 セッションの数。

単位: 数値

ファイルゲートウェイのみ。

TimeSinceLastRecoveryPoint

使用可能な最新の復旧ポイントからの時間。詳細については、「ゲートウェイキャッシュ型が到達不可能なためデータを復旧する場合」を参照してください。

単位: 秒

キャッシュボリュームと保管型ボリューム。

TotalCacheSize

キャッシュの総バイト数。サンプリングは、レポート期間の最後に行われます。

単位: バイト

ファイル、キャッシュ型ボリューム、およびテープゲートウェイ。

UploadBufferPercentUsed

ゲートウェイのアップロードバッファの使用率。サンプリングは、レポート期間の最後に行われます。

単位: パーセント

キャッシュ型ボリュームおよびテープゲートウェイ。

UploadBufferUsed

ゲートウェイのアップロードバッファで使用されている総バイト数。サンプリングは、レポート期間の最後に行われます。

単位: バイト

キャッシュ型ボリュームおよびテープゲートウェイ。

UserCpuPercent

ゲートウェイ処理にかかった CPU 時間の割合 (すべてのコアの平均)。

単位: パーセント

すべてのゲートウェイ。

WorkingStorageFree

ゲートウェイの作業ストレージの未使用領域の量。サンプリングは、レポート期間の最後に行われます。

単位: バイト

保管型ボリュームのみ。

WorkingStoragePercentUsed

ゲートウェイのアップロードバッファの使用率。サンプリングは、レポート期間の最後に行われます。

単位: パーセント

保管型ボリュームのみ。

WorkingStorageUsed

ゲートウェイのアップロードバッファで使用されている総バイト数。サンプリングは、レポート期間の最後に行われます。

単位: バイト

保管型ボリュームのみ。

WriteBytes

ゲートウェイにあるすべてのボリュームを対象としたレポートの期間中に内部設置型のアプリケーションに書き込まれた総バイト数。

このメトリクスを Sum 統計と共に使用してスループットを測定し、Samples 統計と共に使用して IOPS を測定します。

単位: バイト

ファイル、キャッシュ型ボリューム、およびストアドボリュームゲートウェイ。

WriteTime

ゲートウェイにあるすべてのボリュームを対象としたレポートの期間中にオンプレミスのアプリケーションからの書き込みオペレーションにかかった合計時間 (ミリ秒)。

このメトリクスを Average 統計と共に使用してレイテンシーを測定します。

単位: ミリ秒

ファイル、キャッシュ型ボリューム、およびストアドボリュームゲートウェイ。

Storage Gateway メトリクスのディメンション

Storage Gateway サービスの CloudWatch 名前空間は AWS/StorageGateway です。データは自動的に 5 分間無料で取得できます。

ディメンション

説明

GatewayIdGatewayName

このディメンションを指定すると、リクエストしたデータがフィルタリングされて、ゲートウェイ固有のメトリクスのものだけになります。対象となるゲートウェイは、GatewayId または GatewayName の値で特定できます。メトリクスの表示に関連した時間範囲でゲートウェイの名前が異なる場合は、GatewayId を使用します。

ゲートウェイのスループットとレイテンシーデータは、ゲートウェイの全ボリュームによって変動します。ゲートウェイメトリクスの使用の詳細については、「ゲートウェイと AWS の間のパフォーマンスの測定」を参照してください。

VolumeId

このディメンションを指定すると、リクエストしたデータがフィルタリングされて、ボリュームに固有のメトリクスのものだけになります。VolumeId の値によって、使用するストレージボリュームを特定します。ボリュームメトリクスの使用の詳細については、「アプリケーションとゲートウェイの間のパフォーマンスの測定」を参照してください。

アップロードバッファのモニタリング

このセクションでは、ゲートウェイのアップロードバッファをモニタリングする方法と、バッファが特定のしきい値を超えると通知を受け取るようにアラームを作成する方法について説明します。これにより、バッファが完全に消費され、ストレージアプリケーションが AWS へのバックアップを停止する前に、ゲートウェイにバッファストレージを追加できます。

アップロードバッファのモニタリング方法は、キャッシュ型ボリュームおよびテープゲートウェイの両方のアーキテクチャで同じです。詳細については、「AWS Storage Gateway の仕組み (アーキテクチャ)」を参照してください。

注記

WorkingStoragePercentUsedWorkingStorageUsed、および WorkingStorageFree メトリクスは、Storage Gateway のキャッシュ保管型機能がリリースされる前の、保管型ボリュームのみのアップロードバッファを表します。現在は、同等のアップロードバッファメトリクスとして UploadBufferPercentUsedUploadBufferUsed、および UploadBufferFree を使用します。これらのメトリクスは、両方のゲートウェイアーキテクチャに適用されます。

対象となる項目 測定方法
アップロードバッファの使用量

UploadBufferPercentUsedUploadBufferUsed、および UploadBufferFree メトリクスを Average 統計と共に使用します。例えば、期間中のストレージ使用量を分析するには、UploadBufferUsedAverage 統計と共に使用します。

使用されるアップロードバッファの割合を測定するには

  1. https://console.aws.amazon.com/cloudwatch/ にある CloudWatch コンソールを開きます。

  2. [StorageGateway: Gateway Metrics] ディメンションを選択し、対象のゲートウェイを見つけます。

  3. UploadBufferPercentUsed メトリクスを選択します。

  4. [Time Range] で値を選択します。

  5. Average 統計を選択します。

  6. [Period] で、デフォルトのレポート時間に合わせて 5 分を選択します。

表示された時系列のデータポイントのセットには、アップロードバッファの使用率が含まれています。

CloudWatch コンソールを使用してアラームを作成するには、次の手順を実行します。アラームおよびしきい値の詳細については、Amazon CloudWatch ユーザーガイドの「CloudWatch アラームの作成」を参照してください。

ゲートウェイのアップロードバッファの上限アラームを設定するには

  1. https://console.aws.amazon.com/cloudwatch/ にある CloudWatch コンソールを開きます。

  2. [Create Alarm (アラームの作成)] を選択して、アラームの作成ウィザードを起動します。

  3. アラームのメトリクスを指定します。

    1. Create Alarm Wizard の [Select Metric (メトリクスの選択)] ページで、[AWS/StorageGateway:GatewayId,GatewayName] ディメンションを選択し、対象のゲートウェイを見つけます。

    2. UploadBufferPercentUsed メトリクスを選択します。Average 統計および 5 分の期間を使用します。

    3. [Continue] を選択します。

  4. アラームの名前、説明、しきい値を定義します。

    1. Create Alarm Wizard の [Define Alarm (アラームの定義)] ページで、[Name (名前)] ボックスにアラームの名前を、[Description (説明)] ボックスにアラームの説明を入力して、アラームを指定します。

    2. アラームのしきい値を定義します。

    3. [Continue] を選択します。

  5. アラームの E メールアクションを設定します。

    1. Create Alarm Wizard の [Configure Actions (アクションの設定)] ページで、[Alarm State (アラームの状態)] として [Alarm (アラーム)] を選択します。

    2. [Topic] で [Choose or create email topic] を選択します。

      E メールトピックを作成することは、Amazon SNS トピックをセットアップするということです。Amazon SNS の詳細については、Amazon CloudWatch ユーザーガイドの「Amazon SNS のセットアップ」を参照してください。

    3. [トピック] に、トピックを示すわかりやすい名前を入力します。

    4. [Add Action] を選択します。

    5. [Continue] を選択します。

  6. アラーム設定を確認してアラームを作成します。

    1. Create Alarm Wizard の [Review (レビュー)] ページで、アラーム定義、メトリクス、および実行する関連アクション (E メール通知の送信など) を確認します。

    2. アラームの要約を確認したら、[Save Alarm] を選択します。

  7. アラームトピックの受信登録を確認します。

    1. トピックの作成時に指定した E メールアドレス宛に送信されている、Amazon SNS の E メールを開きます。

      次の図は、一般的な E メール通知を示しています。

    2. メール内のリンクをクリックして、受信登録を確認します。

      サブスクリプションの確認が表示されます。

キャッシュストレージのモニタリング

このセクションでは、ゲートウェイのキャッシュストレージをモニタリングする方法と、キャッシュのパラメーターが特定のしきい値を超えると通知を受け取るようにアラームを作成する方法について説明します。このアラームを使用すると、ゲートウェイにキャッシュストレージを追加するタイミングがわかります。

キャッシュストレージのモニタリングは、キャッシュ型ボリュームのアーキテクチャのみで行われます。詳細については、「AWS Storage Gateway の仕組み (アーキテクチャ)」を参照してください。

対象となる項目 測定方法

キャッシュの総使用量

CachePercentUsed および TotalCacheSize メトリクスを Average 統計と共に使用します。たとえば、期間中のストレージのキャッシュ使用状況を分析するには、CachePercentUsedAverage 統計と共に使用します。

TotalCacheSize メトリクスは、ゲートウェイにキャッシュを追加した場合にのみ変化します。

キャッシュから提供された読み取りリクエストの割合

CacheHitPercent メトリクスと共に Average 統計を使用します。

通常、CacheHitPercent は高いままであることが適切です。

ダーティな (AWS にアップロードされていないコンテンツを含む) キャッシュの割合

CachePercentDirty メトリクスと共に Average 統計を使用します。

通常は、CachePercentDirty は低いままにします。

ゲートウェイとそのすべてのボリュームに対してダーティなキャッシュの割合を測定するには

  1. https://console.aws.amazon.com/cloudwatch/ にある CloudWatch コンソールを開きます。

  2. [StorageGateway: Gateway Metrics] ディメンションを選択し、対象のゲートウェイを見つけます。

  3. CachePercentDirty メトリクスを選択します。

  4. [Time Range] で値を選択します。

  5. Average 統計を選択します。

  6. [Period] で、デフォルトのレポート時間に合わせて 5 分を選択します。

表示された時系列のデータポイントのセットには、5 分間のダーティなキャッシュの割合が含まれています。

ボリュームのダーティなキャッシュの割合を測定するには

  1. https://console.aws.amazon.com/cloudwatch/ にある CloudWatch コンソールを開きます。

  2. [StorageGateway: Volume Metrics] ディメンションを選択し、対象のボリュームを見つけます。

  3. CachePercentDirty メトリクスを選択します。

  4. [Time Range] で値を選択します。

  5. Average 統計を選択します。

  6. [Period] で、デフォルトのレポート時間に合わせて 5 分を選択します。

表示された時系列のデータポイントのセットには、5 分間のダーティなキャッシュの割合が含まれています。

CloudWatch アラームについて

CloudWatch アラームは、Storage Gateway コンソールに追加し、視覚的にモニタリングできます。アラームが存在する場合、ALARM 状態になると赤に変わるため、状態を事前にモニタリングしやすくなります。アラームは、持続している状態変化に対してのみアクションを呼び出します。アラームが特定の状態になっただけでは、アクションは呼び出されません。状態が変って、変わった状態が指定期間にわたって維持される必要があります。CloudWatch アラームの詳細については、「Amazon CloudWatch アラームの使用」を参照してください。

注記

CloudWatch を表示するアクセス許可がない場合は、アラームを表示できません。

アクティブ化されたゲートウェイごとに、次の CloudWatch アラームを作成することをお勧めします。

  • 高い IO 待機率: IoWaitpercent >= 20、3 つのデータポイント、15 分以内

  • キャッシュのダーティ率: CachePercentDirty > 80、4 つのデータポイント、20 分以内

  • 可用性通知: AvailabilityNotifications >= 1、1 つのデータポイント、5 分以内

  • ヘルス通知: HealthNotifications >= 1、1 つのデータポイント、5 分以内

    注記

    ヘルス通知アラームを設定できるのは、CloudWatch で以前にゲートウェイのヘルス通知を処理した場合のみです。

次の表に、アラームの状態を示します。

状態 説明

OK

メトリクスや式は、定義されているしきい値の範囲内です。

アラーム

メトリクスまたは式が、定義されているしきい値を超えています。

不十分なデータ

アラームが開始直後であるか、メトリクスが利用できないか、メトリクス用のデータが不足しているため、アラームの状態を判定できません。

なし

ゲートウェイのアラームが作成されていません。新しいアラームを作成する方法については、「Storage Gateway 用 CloudWatch アラームの作成」を参照してください。

使用不可

アラームの状態が不明です。[モニタリング] タブでエラー情報を表示するには、[使用不可] を選択します。

Storage Gateway 用 CloudWatch アラームの作成

CloudWatch は Amazon Simple Notification Service (Amazon SNS) を使用して、アラームの状態が変化したときにアラーム通知を送信します。アラームは、指定期間にわたって単一のメトリクスを監視し、その値と複数期間に対するしきい値との比較結果に基づいて 1 つ以上のアクションを実行します。アクションは、Amazon SNS トピックに送信される通知です。CloudWatch アラームを作成するときに Amazon SNS トピックを作成することもできます。Amazon SNS の詳細については、Amazon Simple Notification Service 開発者ガイドの「Amazon SNS とは」を参照してください。

Storage Gateway コンソールで CloudWatch アラームを作成するには

  1. https://console.aws.amazon.com/storagegateway/home/ で Storage Gateway コンソールを開きます。

  2. ナビゲーションペインで、[ Gateways] を選択します。

  3. ゲートウェイを選択し、アラーム状態または [モニタリング] タブを選択します。

  4. 次のいずれかを行ってください。

    • アラームがない場合は、[CloudWatch アラーム] を選択します。

    • 既存のアラームがある場合は、[アラームの作成] を選択します。

    CloudWatch コンソールが開きます。

  5. アラームを作成します。以下は、CloudWatch アラームのタイプです。

    • 静的しきい値アラーム: 指定のメトリクスに応じて設定されたしきい値に基づくアラーム。指定した評価期間数にわたってメトリクスがしきい値を超えると、アラームが ALARM 状態に移行します。

      静的しきい値アラームを作成するには、Amazon CloudWatch ユーザーガイドの「静的しきい値に基づいて CloudWatch アラームを作成する」を参照してください。

    • 異常検出アラーム: 異常検出では、過去のメトリクスデータのマイニングにより、想定値のモデルが作成されます。異常検出のしきい値を設定すると、CloudWatch は、このしきい値をモデルで使用して、メトリクスの「正常」な値の範囲を決定します。しきい値を高くするほど、「正常」な値の範囲が広がります。アラームがトリガーされるのが、メトリック値が想定値帯を上回る場合、下回る場合、または上回るか下回った場合のいずれかを選択できます。

      異常検出アラームを作成するには、Amazon CloudWatch ユーザーガイドの「異常検出に基づいて CloudWatch アラームを作成する」を参照してください。

    • メトリクス数式アラーム: 1 つ以上のメトリクスを使用した数式に基づくアラーム。式、しきい値、および評価期間を指定します。

      メトリクス数式アラームを作成するには、Amazon CloudWatch ユーザーガイドの「メトリクスの数式に基づく CloudWatch アラームを作成する」を参照してください。

    • 複合アラーム: 他のアラームのアラーム状態を監視してアラーム状態を決定するアラーム。複合アラームは、アラームノイズの低減に役立ちます。

      複合アラームを作成するには、Amazon CloudWatch ユーザーガイドの「複合アラームの作成」を参照してください。

  6. CloudWatch コンソールでアラームを作成したら、Storage Gateway コンソールに戻ります。アラームを表示するには、次のいずれかを行います。

    • ナビゲーションペインで [ゲートウェイ] を選択し、対象のゲートウェイを選択します。[詳細] タブの [アラーム] で、[CloudWatch アラーム] を選択します。

    • ナビゲーションペインで [ゲートウェイ] を選択し、対象のゲートウェイを選択して、[モニタリング] タブを選択します。

    • ナビゲーションペインで [ゲートウェイ] を選択してから、ゲートウェイのアラーム状態を選択します。

アラームを編集または削除するには、「アラーム CloudWatch アラームの編集または削除」を参照してください。