LWLock:BufferIO (IPC:BufferIO) - Amazon Aurora

LWLock:BufferIO (IPC:BufferIO)

当 Aurora PostgreSQL 或 RDS for PostgreSQL 正在等待其他进程在同时尝试访问页面时完成输入/输出 (I/O) 操作时,会发生 LWLock:BufferIO 事件。它的目的是将同一个分页读入共享缓冲区中。

相关引擎版本

此等待事件信息与所有的 Aurora PostgreSQL 版本相关。对于 Aurora PostgreSQL 12 及更早版本,此等待事件命名为 lwlock:buffer_io,而在 Aurora PostgreSQL 13 版本中,则命名为 lwlock:bufferio。从 Aurora PostgreSQL 14 版本开始,BufferIO 等待事件从 LWLock 移到 IPC 等待事件类型(IPC:BufferIO)。

上下文

每个共享缓冲区都有一个与 LWLock:BufferIO 等待事件相关的输入/输出锁,每次必须在共享缓冲池外检索数据块(或分页)。

此锁定用于处理多个会话,而这些会话都需要访问同一个数据块。必须从共享缓冲池外部读取此数据库块,该缓冲池由 shared_buffers 参数定义。

一旦在共享缓冲池内读取分页,LWLock:BufferIO 锁即被释放。

注意

LWLock:BufferIO 等待事件发生在 IO:DataFileRead 等待事件之前。IO:DataFileRead 事件在从存储中读取数据时发生。

有关轻量级锁定的更多信息,请参阅锁定概览

原因

LWLock:BufferIO 显示在主要等待中的常见原因包括以下各项:

  • 多个后端或连接试图访问同样在等待输入/输出操作的同一页面

  • 共享缓冲池大小之间的比率(由 shared_buffers 参数定义)以及当前工作负载所需的缓冲区数量

  • 共享缓冲池的大小与其他操作移出的分页数量没有很好地平衡

  • 需要引擎在共享缓冲池中读取更多页面的臃肿的大索引

  • 缺乏强制数据库引擎从表中读取更多页面的索引

  • 试图在同一页面上执行操作的数据库连接突增

操作

根据等待事件的原因,我们建议采取不同的操作:

  • 观察 Amazon CloudWatch 指标,了解 BufferCacheHitRatio 突然减少和 LWLock:BufferIO 等待事件之间的关系。此影响可能意味着您有一个较小的共享缓冲区设置。您可能需要增加数据库实例类或对其进行纵向扩展。您可以将工作负载拆分为更多的读取器节点。

  • 如果您发现 LWLock:BufferIOBufferCacheHitRatio 指标降低相一致,请根据您的工作负载峰值时间优化 max_wal_sizecheckpoint_timeout。然后确定哪个查询可能会导致发生此情况。

  • 验证是否有未使用的索引,然后将其删除。

  • 使用分区表(也具有分区索引)。这样做有助于保持较低的指数重新排序并降低其影响。

  • 避免对列进行不必要的索引编制。

  • 使用连接池防止数据库连接突增。

  • 作为最佳实践,限制与数据库的最大连接数。