利用集群见解为 Kubernetes 版本升级做好准备并对错误配置进行问题排查 - Amazon EKS

帮助改进此页面

要帮助改进本用户指南,请选择位于每个页面右侧窗格中的在 GitHub 上编辑此页面链接。

利用集群见解为 Kubernetes 版本升级做好准备并对错误配置进行问题排查

Amazon EKS 集群见解提供问题检测和解决问题的建议,以帮助您管理集群。每个 Amazon EKS 集群都会根据 Amazon EKS 精心策划的见解列表进行自动的定期检查。这些见解检查完全由 Amazon EKS 管理,并就如何解决任何调查发现提供建议。

集群见解类型

  • 配置见解:识别 EKS 混合节点设置中可能损害集群或工作负载功能的错误配置。

  • 升级见解:识别可能影响您升级到新版 Kubernetes 能力的问题。

注意事项

  • 频率:Amazon EKS 每 24 小时刷新一次集群见解。您无法手动刷新集群见解。如果您修复集群问题,则将需要一些时间才能更新集群见解。要确定修复是否成功,请将更改部署的时间与见解检查的“上次刷新时间”进行比较。

  • 权限:Amazon EKS 会为每个 EKS 集群中的集群见解自动创建集群访问条目。此条目会授予 EKS 查看有关集群的信息的权限。EKS 使用这些信息来生成见解。有关更多信息,请参阅 AmazonEKSClusterInsightsPolicy

使用案例

Amazon EKS 中的集群见解提供自动检查,可帮助维护 Kubernetes 集群的运行状况、可靠性和最佳配置。以下是集群见解的关键使用案例,包括升级准备情况和配置故障排除。

升级见解

升级见解是集群见解中的一种特定类型的见解检查。这些检查会返回与 Kubernetes 版本升级就绪情况相关的见解。Amazon EKS 会对每个 EKS 集群运行升级见解检查。

重要

Amazon EKS 暂时回滚了一项功能,该功能要求您在遇到某些集群见解问题时使用 --force 标志升级集群。有关更多信息,请参阅 GitHub 上的 Temporary rollback of enforcing upgrade insights on update cluster version

有关更新集群的更多信息,请参阅第 3 步:更新集群控制面板

在更新集群 Kubernetes 版本之前,您可以使用 Amazon EKS 控制台中可观测性控制面板的集群见解选项卡。如果您的集群已发现问题,请查看它们并进行适当的修复。这些问题包括指向 Amazon EKS 和 Kubernetes 文档的链接。修复该问题后,等待集群见解刷新。如果所有问题都已解决,则请更新您的集群

Amazon EKS 会返回与 Kubernetes 版本升级就绪情况相关的见解。升级见解可以发现可能影响 Kubernetes 集群升级的可能问题。这样可以最大限度地减少管理员准备升级所需的工作量,并提高新 Kubernetes 版本上应用程序的可靠性。Amazon EKS 会根据可能影响 Kubernetes 版本升级的问题列表自动扫描集群。Amazon EKS 经常根据对每个 Kubernetes 版本中所做更改的审查来更新见解检查列表。

Amazon EKS 升级见解加快了新版本的测试和验证过程。还允许集群管理员和应用程序开发人员通过强调问题和提供补救建议来利用最新 Kubernetes 功能。

配置见解

EKS 集群见解会自动扫描带有混合节点的 Amazon EKS 集群,以发现影响 Kubernetes 控制面板到 Webhook 通信、exec 和日志等 kubectl 命令执行及其他方面的配置问题。配置见解可以发现问题并提供补救建议,从而加快实现混合节点设置完全正常运行的时间。

开始使用

要查看已执行的见解检查列表以及 Amazon EKS 发现的任何相关问题,您可以使用 AWS Management Console、AWS CLI、AWS SDK 和 Amazon EKS ListInsights API 操作。要开始使用,请参阅 查看集群见解