LWLock:BufferIO (IPC:BufferIO) - Amazon Aurora

LWLock:BufferIO (IPC:BufferIO)

LWLock:BufferIOイベントは、Aurora PostgreSQL または RDS for PostgreSQL が同時にページにアクセスしようとしているときに、他のプロセスが入出力 (I/O) オペレーションの完了を待っているときに発生します。その目的は、同じページを共有バッファに読み込むことです。

関連するエンジンのバージョン

この待機イベント情報は、Aurora PostgreSQL のすべてのバージョンに関連しています。Aurora PostgreSQL 12 以前のバージョンでは、この待機イベントは lwlock:buffer_io という名前でしたが、Aurora PostgreSQL 13 バージョンでは lwlock:bufferio という名前です。Aurora PostgreSQL 14 バージョンから、BufferIO 待機イベントは LWLock から IPC 待機イベントタイプ (IPC:BufferIO) に移動されました。

Context

各共有バッファは、ブロック (またはページ) が共有バッファプールの外部で取得される必要があるたびに、LWLock:BufferIO待機イベントに関連付けられた I/O ロックを持ちます。

このロックは、すべての同じブロックへのアクセスを必要とする複数のセッションを処理するために使用されます。このブロックは、shared_buffersパラメータで定義された共有バッファプールの外部から読み取る必要があります。

共有バッファプール内でページが読み込まれると、LWLock:BufferIOロックが解除されます。

注記

LWLock:BufferIO待機イベントはIO:DataFileRead待機イベントに先行します。IO:DataFileRead待機イベントは、データがストレージから読み込まれている間に発生します。

ライトウェイトロックの詳細については、「ロックの概要」を参照してください。

原因

LWLock:BufferIO上位待機中に表示されるイベントの一般的な原因には、次のものがあります。

  • 複数のバックエンドまたは接続が I/O オペレーションを保留している同じページにアクセスしようとしている

  • 共有バッファプール (shared_buffersパラメータで定義) のサイズと、現在のワークロードが必要とするバッファ数の比率

  • 共有バッファプールのサイズが、他の操作によって削除されるページ数とのバランスが悪い

  • エンジンが共有バッファプールに必要以上のページを読み込む必要がある大規模なインデックスまたは肥大化したインデックス

  • DB エンジンが強制的に必要以上に多くのページをテーブルから読み取るインデックスの欠落

  • 同じページで操作を実行しようとするデータベース接続が突然スパイクする

アクション

待機イベントの原因に応じたさまざまなアクションを実行することをお勧めします。

  • BufferCacheHitRatioの急減とLWLock:BufferIO待機イベントの相関関係のため、Amazon CloudWatch メトリクスを観察します。この効果は、共有バッファの設定が小さいことを意味することがあります。増やすか、DB インスタンスクラスをスケールアップする必要がある場合があります。ワークロードをより多くのリーダーノードに分割できます。

  • LWLock:BufferIOBufferCacheHitRatioのメトリックと一致する場合は、ワークロードのピーク時間に基づいてmax_wal_sizecheckpoint_timeoutをチューニングしてください。次に、原因となっているクエリを特定します。

  • 未使用のインデックスがあるかどうかを確認し、それらを削除します。

  • パーティション化されたテーブルを使用します (パーティション化されたインデックスもあります)。これにより、インデックスの並べ替えを低く抑え、その影響を軽減することができます。

  • 不必要に列のインデックスを作成しないようにします。

  • 接続プールを使用して、突然のデータベース接続スパイクを防ぎます。

  • ベストプラクティスとして、データベースへの最大接続数を制限します。