排查卷问题 - AWS Storage Gateway

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

排查卷问题

您可以找到有关您使用卷时可能遇到的最典型问题以及为解决这些问题我们建议您采取的措施的信息。

控制台显示您的卷未配置

如果 Storage Gateway 控制台显示您的卷的状态为 UPLOAD BUFFER NOTCONFIGURED,请向网关添加上传缓冲区容量。如果网关的上传缓冲区尚未配置,您就不能用网关存储应用程序数据。有关更多信息,请参阅 为网关配置额外的上传缓冲区或缓存存储

控制台显示您的卷无法恢复

对于存储卷,如果 Storage Gateway 控制台显示您的卷的状态为IRRECOVERABLE,则您将无法再使用此卷。您可以尝试在 Storage Gateway 控制台中删除该卷。如果该卷上有数据,您可以在创建新卷时根据最初用来创建该卷的 VM 本地磁盘恢复这些数据。在创建新卷时,请选择 Preserve existing data。移除卷前,请确保删除卷的待创建快照。有关更多信息,请参阅 删除存储卷的快照。如果在 Storage Gateway 控制台中删除该卷不起作用,那么为该卷分配的磁盘可能已错误地从 VM 中移除,并且无法从设备中移除。

对于缓存卷,如果 Storage Gateway 控制台显示您的卷的状态为IRRECOVERABLE,则您将无法再使用此卷。如果卷上有数据,您可以创建卷的快照,然后从快照恢复数据,也可以从上一个恢复点克隆卷。您可以在恢复数据后删除卷。有关更多信息,请参阅 您的缓存网关无法访问,您希望恢复数据

对于存储卷,您可以从曾用于创建无法恢复的卷的磁盘创建新卷。有关更多信息,请参阅 创建存储卷。有关卷状态的信息,请参阅了解卷状态和转换

您的缓存网关无法访问,您希望恢复数据

当您的网关变得无法访问时 (例如,在您关闭网关时),您可以选择从卷恢复点创建快照并使用该快照,也可以选择从现有卷的上一个恢复点克隆新卷。与创建快照相比,从卷恢复点进行克隆将更快且更经济高效。有关克隆卷的更多信息,请参阅从恢复点克隆缓存卷

Storage Gateway 在缓存卷网关架构中提供各个卷的恢复点。卷的恢复点 是一个时间点,该卷在此时间点的所有数据均一致,并且您可以从该点创建快照或克隆卷。

控制台显示您的音量PASSTHROUGH处于状态

在某些情况下,Storage Gateway 控制台可能会指示您的卷的状态为PASSTHROUGH。由于多种原因,卷可能PASSTHROUGH处于状态。对某些原因需要采取措施,而对另一些则不需要。

例如,当您的网关已用完上传缓冲区空间时,如果您的卷PASSTHROUGH处于状态,则应在何时采取行动。要验证过去是否超过了上传缓冲区,您可以在 Amazon CloudWatch 控制台中查看该UploadBufferPercentUsed指标;有关更多信息,请参阅监控上传缓冲区。如果您的网关由于上传缓冲区空间已用完而PASSTHROUGH处于状态,则应为网关分配更多的上传缓冲区空间。 添加更多缓冲空间会使您的音量AVAILABLE自动从变PASSTHROUGHBOOTSTRAPPING为。当卷BOOTSTRAPPING处于状态时,网关会从卷的磁盘上读取数据,将这些数据上传到 Amazon S3,然后根据需要进行追踪。当网关已赶上并将卷数据保存到 Amazon S3 时,卷状态变为AVAILABLE,可以重新启动快照。请注意,当您的卷BOOTSTRAPPING处于PASSTHROUGH或状态时,您可以继续从卷磁盘读取和写入数据。有关添加更多上传缓冲区空间的更多信息,请参阅 确定要分配的上传缓冲区的大小

如需在超出上传缓冲区空间前采取行动,您可以对网关的上传缓冲区设置阈值警报。有关更多信息,请参阅 如需为网关的上传缓冲区设置上阈值警报

相比之下,当一个卷PASSTHROUGH处于状态时,不需要采取措施的一个例子是,由于另一个卷当前正在被引导,该卷正在等待引导。网关在同一时间自举一个卷。

这种PASSTHROUGH状态很少会表示为上传缓冲区分配的磁盘出现故障。在此情况下,您应该移除磁盘。有关更多信息,请参阅 使用卷网关存储资源。有关卷状态的信息,请参阅了解卷状态和转换

您要验证卷的完整性并修复可能的错误

如果您想验证卷的完整性并修复可能的错误,并且您的网关使用 Microsoft Windows 启动器连接到其卷,则可以使用 Windows CHKDSK 实用程序来验证卷的完整性并修复卷上的任何错误。当检测到卷损坏时,Windows 可以自动运行该CHKDSK工具,或者你可以自己运行它。

你的卷的 i SCSI 目标未显示在 Windows 磁盘管理控制台中

如果您的卷的 i SCSI 目标未显示在 Windows 的磁盘管理控制台中,请检查您是否已为网关配置了上传缓冲区。有关更多信息,请参阅 为网关配置额外的上传缓冲区或缓存存储

你想更改卷的 i targe SCSI t 名称

如果要更改卷的 i targe SCSI t 名称,则必须删除该卷,然后使用新的目标名称重新添加该卷。如果这样做,您可以将数据保存在卷上。

您计划的卷快照未创建

如果未生成卷的计划快照,请检查您的卷是否PASSTHROUGH处于状态,或者网关的上传缓冲区是否在计划的快照时间之前已填满。您可以在 Amazon CloudWatch 控制台中查看网关的UploadBufferPercentUsed指标,并为该指标创建警报。有关更多信息,请参阅监控上传缓冲区如需为网关的上传缓冲区设置上阈值警报

您需要移除或更换出现故障的磁盘

如果您需要更换出现故障的卷磁盘或更换不再需要的卷,则应先使用 Storage Gateway 控制台移除该卷。有关更多信息,请参阅 删除卷。然后使用管理程序客户端移除备份存储:

  • 对于 VMwareESXi,请按中所述移除后备存储空间删除存储卷

  • 对于 Microsoft Hyper-V,请删除支持存储。

从应用程序到卷的吞吐量降为零

如果从应用程序到卷的吞吐量降为零,请尝试以下操作:

  • 如果您使用的是VMware vSphere 客户端,请检查您的卷的主机 IP 地址是否与 vSphere 客户端中显示的 “摘要” 选项卡上的其中一个地址相匹配。您可以在 Storage Gateway 控制台中存储卷的详细信息选项卡中找到该卷的主机 IP 地址。举例而言,在您向网关分配新的静态 IP 地址的情况下,可能会发生 IP 地址的不一致情况。如果出现不一致,请从 Storage Gateway 控制台重启您的网关,如关闭网关虚拟机中所述。重新启动后,存储卷的 “ISCSI目标信息” 选项卡中的主机 IP 地址应与网关的 “摘要” 选项卡上 vSphere 客户端上显示的 IP 地址相匹配。

  • 如果 Host IP 框中没有该卷的 IP 地址,网关处于联机状态。例如,当您创建的卷与配有两个或两个以上网络适配器的网关中某个网络适配器的 IP 地址关联时,就会出现此情况。当您移除或停用与该卷关联的网络适配器时,主机 IP 框中可能不会显示 IP 地址。要解决这一问题,请在保存现有数据的同时移除卷然后重新创建。

  • 检查您的应用程序使用的 i SCSI 启动器是否正确映射到存储卷的 i SCSI 目标。有关连接到存储卷的更多信息,请参阅 从 Windows 客户端连接到您的卷

您可以从 Amazon CloudWatch 控制台查看卷的吞吐量并创建警报。有关测量应用程序到卷的吞吐量的更多信息,请参阅衡量您的应用程序和网关间的性能。

您网关中的一个缓存磁盘遇到了故障

如果网关中的一个或多个缓存磁盘出现故障,则该网关会阻止对虚拟磁带执行读写操作。要恢复正常功能,请按如下所述重新配置网关:

  • 如果缓存磁盘无法访问或不可用,请从网关配置中删除该磁盘。

  • 如果缓存磁盘仍然可以访问和使用,请将其重新连接到您的网关。

注意

如果删除缓存磁盘,则当网关恢复正常功能时,拥有干净数据的磁带或卷(即其缓存磁盘中的数据和 Amazon S3 中的数据已同步)将继续可用。例如,如果您的网关有三个缓存磁盘,而您删除了两个缓存磁盘,则干净的磁带或卷将AVAILABLE处于状态。其他磁带和卷将IRRECOVERABLE处于状态。

如果您使用临时磁盘作为网关的缓存磁盘或将缓存磁盘装载到临时驱动器,则关闭网关时缓存磁盘将丢失。在缓存磁盘和 Amazon S3 未同步时关闭网关会导致数据丢失。因此,我们不建议使用临时驱动器或磁盘。

卷快照的PENDING状态比预期的要长

如果卷快照保持PENDING状态的时间长于预期,则网关 VM 可能意外崩溃,或者卷的状态可能已更改为PASSTHROUGH或IRRECOVERABLE。如果是其中任何一种情况,则快照将保持PENDING状态,并且快照将无法成功完成。如果出现这些情况,建议您删除快照。有关更多信息,请参阅 删除存储卷的快照

当卷恢复到AVAILABLE状态时,创建该卷的新快照。有关卷状态的信息,请参阅了解卷状态和转换

高可用性运行状况通知

在VMware vSphere 高可用性 (HA) 平台上运行网关时,您可能会收到运行状况通知。有关运行状况通知的更多信息,请参阅排查高可用性问题