LWLock:BufferIO - Amazon Aurora

LWLock:BufferIO

LWLock:BufferIOイベントは、Aurora PostgreSQL または RDS for PostgreSQL が同時にページにアクセスしようとしているときに、他のプロセスが入出力 (I/O) オペレーションの完了を待っているときに発生します。その目的は、同じページを共有バッファに読み込むことです。

関連するエンジンのバージョン

この待機イベント情報は、すべての Aurora PostgreSQL 13 バージョンに関連しています。

Context

各共有バッファは、ブロック (またはページ) が共有バッファプールの外部で取得される必要があるたびに、LWLock:BufferIO待機イベントに関連付けられた I/O ロックを持ちます。

このロックは、すべての同じブロックへのアクセスを必要とする複数のセッションを処理するために使用されます。このブロックは、shared_buffersパラメータで定義された共有バッファプールの外部から読み取る必要があります。

共有バッファプール内でページが読み込まれると、LWLock:BufferIOロックが解除されます。

注記

LWLock:BufferIO待機イベントはIO:DataFileRead待機イベントに先行します。IO:DataFileRead待機イベントは、データがストレージから読み込まれている間に発生します。

ライトウェイトロックの詳細については、「ロックの概要」を参照してください。

原因

LWLock:BufferIO上位待機中に表示されるイベントの一般的な原因には、次のものがあります。

  • 複数のバックエンドまたは接続が I/O オペレーションを保留している同じページにアクセスしようとしている

  • 共有バッファプール (shared_buffersパラメータで定義) のサイズと、現在のワークロードが必要とするバッファ数の比率

  • 共有バッファプールのサイズが、他の操作によって削除されるページ数とのバランスが悪い

  • エンジンが共有バッファプールに必要以上のページを読み込む必要がある大規模なインデックスまたは肥大化したインデックス

  • DB エンジンが強制的に必要以上に多くのページをテーブルから読み取るインデックスの欠落

  • チェックポイント発生が頻繁すぎたり、変更されたページをフラッシュする必要が多すぎる

  • 同じページで操作を実行しようとするデータベース接続が突然スパイクする

アクション

待機イベントの原因に応じたさまざまなアクションを実行することをお勧めします。

  • BufferCacheHitRatioの急減とLWLock:BufferIO待機イベントの相関関係のため、Amazon CloudWatch メトリクスを観察します。この効果は、共有バッファの設定が小さいことを意味することがあります。増やすか、DB インスタンスクラスをスケールアップする必要がある場合があります。ワークロードをより多くのリーダーノードに分割できます。

  • LWLock:BufferIOBufferCacheHitRatioのメトリックと一致する場合は、ワークロードのピーク時間に基づいてmax_wal_sizecheckpoint_timeoutをチューニングしてください。次に、原因となっているクエリを特定します。

  • 未使用のインデックスがあるかどうかを確認し、それらを削除します。

  • パーティション化されたテーブルを使用します (パーティション化されたインデックスもあります)。これにより、インデックスの並べ替えを低く抑え、その影響を軽減することができます。

  • 不必要に列のインデックスを作成しないようにします。

  • 接続プールを使用して、突然のデータベース接続スパイクを防ぎます。

  • ベストプラクティスとして、データベースへの最大接続数を制限します。