调试 Amazon GameLift 实例集问题 - Amazon GameLift

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

调试 Amazon GameLift 实例集问题

本主题提供有关 Amazon GameLift 托管解决方案的实例集配置问题的指导。对于其他故障排除,您可以在实例集处于活动状态后远程访问实例集实例。请参阅远程连接到 Amazon GameLift 舰队实例

实例集创建问题

创建实例集后,Amazon GameLift 服务会启动一个工作流程,在实例集的每个位置部署一个新实例,并为运行游戏服务器做好准备。有关详细说明,请参阅Amazon GameLift 实例集创建的工作原理。实例集在进入活动状态之前无法托管游戏会话和玩家。本节讨论阻碍实例集进入活动状态的最常见问题。

下载和验证

在此阶段,如果提取构建文件存在问题,安装脚本将不会运行,或者如果运行时配置中指定的可执行文件未包含在构建文件中,实例集创建可能失败。Amazon GameLift 提供与每个问题相关的日志。

如果日志未显示问题,则可能问题是由内部服务错误造成的。在这种情况下,请再次尝试创建实例集。如果问题仍然存在,请考虑重新上传游戏构建(如果文件已损坏)。您还可以联系 Amazon GameLift 支持或在论坛上发布问题。

构建

导致生成阶段故障的问题几乎肯定是由于游戏构建文件和/或安装脚本的问题。验证上传到 Amazon GameLift 时,游戏构建文件是否可以安装在运行适当操作系统的计算机上。确保使用干净的操作系统安装,而不是现有的开发环境。

激活

激活阶段出现的最常见实例集创建问题。此阶段测试大量元素,包括游戏服务器的可行性、运行时配置设置以及游戏服务器使用服务器软件开发工具包与 Amazon GameLift 服务进行交互的能力。实例集激活过程中遇到的常见问题包括:

服务器进程无法启动。

首先检查您是否在实例集的运行时配置中正确设置了启动路径和可选启动参数。您可以使用实例集详细信息页面、详细信息部分或者调用 AWS CLI 命令 describe-runtime-configuration 来查看实例集的当前运行时配置。如果运行时配置正确,请检查游戏构建文件和/或安装脚本是否存在问题。

服务器进程启动但实例集无法激活。

如果服务器进程启动并成功运行,但实例集未变为活动状态,可能的原因是服务器进程无法通知 Amazon GameLift 已准备好托管游戏会话。检查您的游戏服务器是否正确调用了服务器 API 操作 ProcessReady() (请参阅初始化服务器进程)。

VPC 对等连接请求失败。

对于使用 VPC 对等连接创建的实例集(请参阅使用新实例集设置 VPC 对等连接),VPC 对等连接在此激活阶段中完成。如果 VPC 对等连接由于任何原因失败,新实例集将无法转入激活状态。通过调用 describe-vpc-peering-connections,您可以跟踪对等请求的成功或失败。请务必检查存在有效的 VPC 对等连接授权 (describe-vpc-peering-authorizations,因为授权仅在 24 小时内有效。

服务器进程问题

服务器进程启动但快速失败或者报告运行状况不佳。

不同于游戏构建中的问题,同时在实例上尝试运行了过多服务器进程时可能会发生这种情况。并发进程的最佳数目取决于实例类型和您的游戏服务器的资源要求。请尝试减少并发进程数量,该值在实例集的运行时配置中设置,以查看性能是否有所改进。您可以使用 Amazon GameLift 控制台(编辑实例集的容量分配设置)或者调用 AWS CLI 命令 update-runtime-configuration 来更改实例集的运行时配置。

实例集删除问题

由于最大实例计数而无法终止实例集。

错误消息指示正在删除的实例集仍有活动的实例,这种情况是不允许的。您必须首先将实例集缩减到零个活动实例。要执行此操作,可以手动将实例集所需的实例计数设置为“0”,然后等待缩减生效。请务必关闭自动扩展,否则会抵消手动设置。

VPC 操作未获授权。

此问题仅适用于您专门为其创建 VPC 对等连接的实例集(请参阅Amazon GameLift 的 VPC 对等连接)。之所以出现这种情况,是因为删除实例集的过程还包括删除实例集的 VPC 和所有 VPC 对等连接。必须首先通过调用 Amazon GameLift 服务 API CreateVpcPeeringAuthorization() 或使用 AWSCLI 命令create-vpc-peering-authorization来获得授权。获得授权之后,您就可以删除该实例集。

实时服务器实例集问题

僵尸游戏会话:这些会话启动和运行游戏,但永不结束。

您可能会观察到此问题在以下任意场景中出现:

  • 实例集的实时服务器未选取脚本更新。

  • 实例集快速达到最大容量,但在玩家活动(例如新游戏会话请求)减少时不缩减。

这几乎可以肯定是无法在您的实时脚本中成功调用 processEnding 的结果。虽然实例集进入活动状态并且启动了游戏会话,但没有方法可以停止它们。因此,运行游戏会话的实时服务器永远不会释放资源来启动新会话,而新游戏会话只能在新实时服务器启动时启动。此外,对实时脚本的更新不影响已经运行的游戏会话,仅影响新的会话。

为了防止出现这种情况,脚本需要提供一种机制来触发 processEnding 调用。如 实时服务器脚本示例中所示,一种方法是编写空闲会话超时,如果在特定时间长度内没有玩家连接,则脚本将结束当前游戏会话。

但是,如果您出现了这种情况,还有多种解决方法可以让实时服务器摆脱卡顿的状况。诀窍是触发实时服务器进程(或底层实例集实例)重启。在这种情况下,GameLift 会自动关闭您的游戏会话。一旦释放实时服务器,它们就可以使用实时脚本的最新版本来启动新游戏会话。

根据问题的普遍性,有几种方法可以做到这一点:

  • 缩减整个实例集。此方法执行起来最简单,但具有扩散效应。将实例集缩减为零个实例,等待实例集完全缩减,然后将其扩展回。这将清除所有现有游戏会话,并让您使用最近更新的实时脚本来从头开始。

  • 远程访问该实例并重新启动该过程。如果您只有几个进程需要修复,这是一个很好的选项。如果您已登录到该实例,例如用于跟踪日志或调试,则这可能是最快的方法。请参阅远程连接到 Amazon GameLift 舰队实例

如果您选择不在实时脚本中包含调用 processEnding 的方法,则可能会出现一些棘手的情况,即使实例集进入活动状态并且游戏会话已启动。首先,正在运行的游戏会话不结束。因此,游戏会话永远不会释放正在运行的服务器进程来启动新游戏会话。其次,实时服务器不会选取任何脚本更新。