Capacité insuffisante Les nœuds ne parviennent pas à joindre le cluster Accès non autorisé ou refusé (kubectl)hostname doesn’t match getsockopt: no route to host Instances failed to join the Kubernetes cluster Codes d'erreurs liées aux groupes de nœuds gérés Not authorized for images Le nœud est en NotReady état Collecteur de journaux EKS Le réseau d'exécution du conteneur n'est pas prêt Délai d'expiration de la liaison TLS InvalidClientTokenId Les groupes de nœuds doivent correspondre à la version de Kubernetes avant de mettre à niveau le plan de contrôle Lors du lancement de nombreux nœuds, des erreurs Too Many Requests se produisent Réponse d'erreur non autorisée HTTP 401 sur les requêtes du serveur API Kubernetes La version de la plateforme Amazon EKS est inférieure de plus de deux versions à la version actuelle de la plateforme Codes d'erreur FAQs et d'intégrité du cluster avec chemins de résolution

Aidez à améliorer cette page

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Pour contribuer à ce guide de l'utilisateur, cliquez sur le GitHub lien Modifier cette page sur qui se trouve dans le volet droit de chaque page.

Résoudre les problèmes liés aux clusters et nœuds Amazon EKS

Ce chapitre traite de certaines erreurs courantes que vous pouvez rencontrer lorsque vous utilisez Amazon EKS, ainsi que des solutions. Si vous avez besoin de dépanner des zones spécifiques d'Amazon EKS, consultez les rubriques Dépannage IAM, Résoudre les problèmes liés au connecteur Amazon EKS et Dépannage d'ADOT à l'aide de modules complémentaires EKS.

Pour d'autres informations de dépannage, consultez le contenu du centre de connaissances sur Amazon Elastic Kubernetes Service sur Re:post. AWS

Capacité insuffisante

Si vous recevez le message d'erreur suivant lors de la tentative de création d'un cluster Amazon EKS, cela signifie que l'une des zones de disponibilité que vous avez spécifiées ne dispose pas d'une capacité suffisante pour prendre en charge un cluster.

Cannot create cluster 'example-cluster' because region-1d, the targeted Availability Zone, does not currently have sufficient capacity to support the cluster. Retry and choose from these Availability Zones: region-1a, region-1b, region-1c

Essayez à nouveau de créer votre cluster avec des sous-réseaux de votre VPC de cluster hébergés dans les zones de disponibilité renvoyés par ce message d'erreur.

Il existe des zones de disponibilité dans lesquelles un cluster ne peut pas résider. Comparez les zones de disponibilité dans lesquelles se trouvent vos sous-réseaux avec la liste des zones de disponibilité figurant dans la section Exigences et considérations relatives aux sous-réseaux.

Les nœuds ne parviennent pas à joindre le cluster

Quelques raisons courantes empêchent les nœuds de joindre le cluster :

Si les nœuds sont des nœuds gérés, Amazon EKS ajoute des entrées à la ConfigMap aws-auth lorsque vous créez le groupe de nœuds. Si l’entrée a été supprimée ou modifiée, vous devez l’ajouter de nouveau. Pour plus d’informations, entrez eksctl create iamidentitymapping --help dans votre terminal. Vous pouvez afficher vos aws-auth ConfigMap entrées actuelles my-cluster en remplaçant la commande suivante par le nom de votre cluster, puis en exécutant la commande modifiée :eksctl get iamidentitymapping --cluster my-cluster. L'ARN du rôle que vous spécifiez ne peut pas inclure de chemin autre que/. Par exemple, si le nom de votre rôle estdevelopment/apps/my-role, vous devrez le remplacer my-role lorsque vous spécifiez l'ARN du rôle. Assurez-vous que vous spécifiez l'ARN pour le rôle IAM du nœud (et non l'ARN du profil d'instance).

Si les nœuds sont autogérés et que vous n'avez pas créé d'entrées d'accès pour l'ARN du rôle IAM du nœud, exécutez les mêmes commandes répertoriées pour les nœuds gérés. Si vous avez créé une entrée d’accès pour l’ARN du rôle IAM de votre nœud, il se peut qu’elle ne soit pas correctement configurée dans l’entrée d’accès. Assurez-vous que l’ARN du rôle IAM du nœud (et non l’ARN du profil d’instance) est spécifié comme ARN principal dans votre entrée de ConfigMap aws-auth ou dans votre entrée d’accès. Pour plus d'informations sur les entrées d'accès, consultez Accorder aux utilisateurs IAM l'accès à Kubernetes avec des entrées d'accès EKS.
Le AWS CloudFormation modèle ClusterNamede votre nœud ne correspond pas exactement au nom du cluster que vous souhaitez que vos nœuds rejoignent. La transmission d'une valeur incorrecte à ce champ entraîne une configuration incorrecte du /var/lib/kubelet/kubeconfig fichier du nœud et les nœuds ne rejoindront pas le cluster.

Le nœud n'est pas étiqueté comme appartenant au cluster. La balise suivante doit être appliquée à vos nœuds, où my-cluster est remplacé par le nom de votre cluster.

Clé	Valeur
`kubernetes.io/cluster/my-cluster`	`owned`

Les nœuds peuvent ne pas être en mesure d'accéder au cluster à l'aide d'une adresse IP publique. Assurez-vous qu'une adresse IP publique est attribuée aux nœuds déployés dans les sous-réseaux publics. Dans le cas contraire, vous pouvez associer une adresse IP élastique à un nœud après son lancement. Pour plus d'informations, consultez Association d'une adresse IP élastique à une instance en cours d'exécution ou à une interface réseau. Si le sous-réseau public n'est pas défini pour attribuer automatiquement des adresses IP publiques aux instances qui y sont déployées, nous vous recommandons d'activer ce paramètre. Pour plus d'informations, consultez la section Modification de l'attribut d' IPv4 adressage public de votre sous-réseau. Si le nœud est déployé sur un sous-réseau privé, ce sous-réseau doit disposer d'une route vers une passerelle NAT à laquelle une adresse IP publique est attribuée.
Le point de terminaison AWS STS de la AWS région dans laquelle vous déployez les nœuds n'est pas activé pour votre compte. Pour activer la région, voir Activation et désactivation du AWS STS dans une AWS région.
Le nœud ne possède pas d'entrée DNS privée, ce qui entraîne une node "" not found erreur dans le kubelet journal. Assurez-vous que le VPC sur lequel le nœud est créé a des valeurs définies pour domain-name et domain-name-servers comme Options dans un DHCP options set. Les valeurs par défaut sont domain-name:<region>.compute.internal et domain-name-servers:AmazonProvidedDNS. Pour en savoir plus, consultez Jeux d'options DHCP dans le Guide de l'utilisateur Amazon VPC.
Si les nœuds du groupe de nœuds gérés ne se connectent pas au cluster dans les 15 minutes, un problème de santé de type NodeCreationFailure « » sera émis et le statut de la console sera défini surCreate failed. Pour Windows AMIs dont les temps de lancement sont lents, ce problème peut être résolu à l'aide du lancement rapide.

Pour identifier et résoudre les problèmes courants qui empêchent les composants master de rejoindre un cluster, vous pouvez utiliser le runbookAWSSupport-TroubleshootEKSWorkerNode. Pour plus d'informations, consultez le manuel AWSSupport-TroubleshootEKSWorkerNode de référence du runbook AWS Systems Manager Automation.

Accès non autorisé ou refusé (`kubectl`)

Si vous recevez l'une des erreurs suivantes lors de l'exécution de kubectl commandes, cela signifie que vous n'avez pas correctement kubectl configuré Amazon EKS ou que les informations d'identification du principal IAM (rôle ou utilisateur) que vous utilisez ne correspondent pas à un nom d'utilisateur Kubernetes disposant d'autorisations suffisantes pour accéder aux objets Kubernetes de votre cluster Amazon EKS.

could not get token: AccessDenied: Access denied
error: You must be logged in to the server (Unauthorized)
error: the server doesn’t have a resource type "svc"

Cela peut être dû à l'une des raisons suivantes :

Le cluster a été créé avec les informations d'identification d'un principal IAM et kubectl est configuré pour utiliser les informations d'identification d'un autre principal IAM. Pour résoudre ce problème, mettez à jour votre fichier kube config afin d’utiliser les informations d’identification à l’origine de la création du cluster. Pour de plus amples informations, veuillez consulter Connect kubectl à un cluster EKS en créant un fichier kubeconfig.
Si votre cluster répond aux exigences de plate-forme minimales indiquées dans la section Conditions préalables de la section Accorder aux utilisateurs IAM l'accès à Kubernetes avec des entrées d'accès EKS, aucune entrée d'accès n'existe auprès de votre principal IAM. S'il existe, les noms de groupes Kubernetes nécessaires ne lui sont pas définis ou la politique d'accès appropriée n'y est pas associée. Pour de plus amples informations, veuillez consulter Accorder aux utilisateurs IAM l'accès à Kubernetes avec des entrées d'accès EKS.
Si votre cluster ne répond pas aux exigences minimales de plate-forme énoncées dans Accorder aux utilisateurs IAM l'accès à Kubernetes avec des entrées d'accès EKS, aucune entrée avec votre principal IAM n'existe dans le. aws-auth ConfigMap S'il existe, il n'est pas mappé aux noms de groupes Kubernetes liés à un Role Kubernetes ou dotés des autorisations nécessaires. ClusterRole Pour plus d'informations sur les objets d'autorisation basée sur les rôles (RBAC) Kubernetes, consultez la section Utilisation de l'autorisation RBAC dans la documentation de Kubernetes. Vous pouvez afficher vos aws-auth ConfigMap entrées actuelles my-cluster en remplaçant la commande suivante par le nom de votre cluster, puis en exécutant la commande modifiée :eksctl get iamidentitymapping --cluster my-cluster. Si aucune entrée contenant l'ARN de votre principal IAM ne figure dans leConfigMap, entrez eksctl create iamidentitymapping --help dans votre terminal pour savoir comment en créer une.

Si vous installez et configurez la AWS CLI, vous pouvez configurer les informations d'identification IAM que vous utilisez. Pour plus d'informations, consultez la section Configuration de la AWS CLI dans le guide de l'utilisateur de l'interface de ligne de AWS commande. Vous pouvez également configurer kubectl pour utiliser un rôle IAM, si vous assumez un rôle IAM pour accéder aux objets Kubernetes de votre cluster. Pour de plus amples informations, veuillez consulter Connect kubectl à un cluster EKS en créant un fichier kubeconfig.

`hostname doesn’t match`

La version Python de votre système doit être 2.7.9 ou ultérieure. Dans le cas contraire, vous recevrez hostname doesn’t match des erreurs lors des appels AWS CLI vers Amazon EKS. Pour plus d'informations, voir Quelles sont les erreurs « le nom d'hôte ne correspond pas » ? dans les questions fréquemment posées sur les requêtes Python.

`getsockopt: no route to host`

Docker s'exécute dans la plage d'adresses CIDR 172.17.0.0/16 dans les clusters Amazon EKS. Nous recommandons que les sous-réseaux VPC de votre cluster ne chevauchent pas cette plage. Sinon, vous recevrez l'erreur suivante :


Error: : error upgrading connection: error dialing backend: dial tcp 172.17.<nn>.<nn>:10250: getsockopt: no route to host

`Instances failed to join the Kubernetes cluster`

Si le message d'erreur s'affiche Instances failed to join the Kubernetes cluster dans le AWS Management Console, assurez-vous que l'accès au point de terminaison privé du cluster est activé ou que vous avez correctement configuré les blocs CIDR pour l'accès au point de terminaison public. Pour de plus amples informations, veuillez consulter Point de terminaison du serveur API du cluster.

Codes d'erreurs liées aux groupes de nœuds gérés

Si votre groupe de nœuds gérés rencontre un problème d'intégrité matérielle, Amazon EKS renvoie un code d'erreur pour vous aider à diagnostiquer le problème. Ces bilans de santé ne détectent pas les problèmes logiciels car ils sont basés sur les bilans de EC2 santé d'Amazon. La liste suivante décrit les codes d'erreur.

AccessDenied

Amazon EKS ou un ou plusieurs de vos nœuds gérés ne parviennent pas à s'authentifier ou à autoriser auprès de votre serveur API de cluster Kubernetes. Pour de plus amples informations sur la résolution d'une cause courante, consultez Correction d'une cause courante d'erreurs AccessDenied pour les groupes de nœuds gérés. AMIs Les fenêtres privées peuvent également provoquer ce code d'erreur en même temps que le message Not authorized for images d'erreur. Pour de plus amples informations, veuillez consulter Not authorized for images.

AmiIdNotFound

Nous n'avons pas trouvé l'ID AMI associé à votre modèle de lancement. Assurez-vous que l'AMI existe et est partagée avec votre compte.

AutoScalingGroupNotFound

Nous n'avons pas trouvé le groupe Auto Scaling associé au groupe de nœuds gérés. Vous pouvez peut-être recréer un groupe Auto Scaling avec les mêmes paramètres pour effectuer une récupération.

ClusterUnreachable

Amazon EKS ou un ou plusieurs de vos nœuds gérés ne peuvent pas communiquer avec le serveur API de votre cluster Kubernetes. Cela peut se produire s'il y a des interruptions de réseau ou si les serveurs d'API temporisent le traitement des demandes.

Eco 2 SecurityGroupNotFound

Nous n'avons pas pu trouver le groupe de sécurité du cluster pour le cluster. Vous devez recréer votre cluster.

Eco 2 SecurityGroupDeletionFailure

Nous n'avons pas pu supprimer le groupe de sécurité d'accès à distance pour votre groupe de nœuds gérés. Supprimez toutes les dépendances du groupe de sécurité.

Eco 2 LaunchTemplateNotFound

Nous n'avons pas trouvé le modèle de EC2 lancement Amazon pour votre groupe de nœuds géré. Vous devez recréer votre groupe de nœuds pour effectuer une récupération.

Eco 2 LaunchTemplateVersionMismatch

La version du modèle de EC2 lancement Amazon pour votre groupe de nœuds gérés ne correspond pas à la version créée par Amazon EKS. Vous pouvez peut-être revenir à la version Amazon EKS créée pour effectuer une récupération.

IamInstanceProfileNotFound

Nous n'avons pas trouvé le profil d'instance IAM pour votre groupe de nœuds gérés. Vous pouvez peut-être recréer un profil d'instance avec les mêmes paramètres pour effectuer une récupération.

IamNodeRoleNotFound

Nous n'avons pas trouvé le rôle IAM pour votre groupe de nœuds gérés. Vous pouvez peut-être recréer un rôle IAM avec les mêmes paramètres pour effectuer une récupération.

AsgInstanceLaunchFailures

Votre groupe Auto Scaling rencontre des problèmes lors d'une tentative de lancement d'instances.

NodeCreationFailure

Vos instances lancées ne peuvent pas s'enregistrer auprès de votre cluster Amazon EKS. Les causes courantes de cet échec sont des autorisations de rôle IAM de nœud insuffisantes ou l'absence d'un accès Internet sortant pour les nœuds. Vos nœuds doivent répondre à l'une des exigences suivantes :

Accès à Internet à l'aide d'une adresse IP publique. Le groupe de sécurité associé au sous-réseau dans lequel se trouve le nœud doit autoriser la communication. Pour plus d’informations, consultez Exigences et considérations requises pour les sous-réseaux et Afficher les exigences relatives aux groupes de sécurité Amazon EKS pour les clusters.
Vos nœuds et VPC doivent répondre aux exigences de la section Déployer des clusters privés avec un accès Internet limité.

InstanceLimitExceeded

Votre AWS compte ne peut plus lancer d'instances du type d'instance spécifié. Vous pouvez peut-être demander une augmentation de la limite d' EC2 instance Amazon pour récupérer.

InsufficientFreeAddresses

Un ou plusieurs sous-réseaux associés à votre groupe de nœuds gérés ne disposent pas d'un nombre suffisant d'adresses IP disponibles pour les nouveaux nœuds.

InternalFailure

Ces erreurs sont généralement dues à un problème côté serveur Amazon EKS.

La cause la plus courante d'erreurs AccessDenied lors de la réalisation d'opérations sur des groupes de nœuds gérés est l'absence de eks:node-manager ClusterRole ou ClusterRoleBinding. Amazon EKS configure ces ressources dans votre cluster dans le cadre de l'onboarding avec les groupes de nœuds gérés, et celles-ci sont nécessaires pour gérer les groupes de nœuds.

La ClusterRole peut changer au fil du temps, mais elle doit ressembler à l'exemple suivant :


apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
  name: eks:node-manager
rules:
- apiGroups:
  - ''
  resources:
  - pods
  verbs:
  - get
  - list
  - watch
  - delete
- apiGroups:
  - ''
  resources:
  - nodes
  verbs:
  - get
  - list
  - watch
  - patch
- apiGroups:
  - ''
  resources:
  - pods/eviction
  verbs:
  - create

La ClusterRoleBinding peut changer au fil du temps, mais elle doit ressembler à l'exemple suivant :


apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
  name: eks:node-manager
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: eks:node-manager
subjects:
- apiGroup: rbac.authorization.k8s.io
  kind: User
  name: eks:node-manager

Vérifiez que la eks:node-manager ClusterRole existe.


kubectl describe clusterrole eks:node-manager

Si elle est présente, comparez la sortie à l'exemple de la ClusterRoleprécédente.

Vérifiez que la eks:node-manager ClusterRoleBinding existe.


kubectl describe clusterrolebinding eks:node-manager

Si elle est présente, comparez la sortie à l'exemple de la ClusterRoleBindingprécédente.

Si vous avez identifié un élément manquant, défectueux ClusterRole ou à ClusterRoleBinding l'origine d'une AcessDenied erreur lors de la demande d'opérations de groupe de nœuds gérés, vous pouvez le restaurer. Enregistrez le contenu suivant dans un fichier nommé eks-node-manager-role.yaml.


apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
  name: eks:node-manager
rules:
- apiGroups:
  - ''
  resources:
  - pods
  verbs:
  - get
  - list
  - watch
  - delete
- apiGroups:
  - ''
  resources:
  - nodes
  verbs:
  - get
  - list
  - watch
  - patch
- apiGroups:
  - ''
  resources:
  - pods/eviction
  verbs:
  - create
---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
  name: eks:node-manager
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: eks:node-manager
subjects:
- apiGroup: rbac.authorization.k8s.io
  kind: User
  name: eks:node-manager

Appliquez le fichier.


kubectl apply -f eks-node-manager-role.yaml

Réessayez l'opération de groupe de nœuds pour voir si cela a résolu votre problème.

`Not authorized for images`

L'une des causes potentielles d'un message Not authorized for images d'erreur est l'utilisation d'une AMI Windows Amazon EKS privée pour lancer des groupes de nœuds gérés par Windows. Après la sortie de nouveaux Windows AMIs, AWS AMIs les versions datant de plus de 4 mois deviennent privées, ce qui les rend inaccessibles. Si votre groupe de nœuds gérés utilise une AMI Windows privée, pensez à mettre à jour votre groupe de nœuds gérés Windows. Bien que nous ne puissions pas garantir que nous puissions fournir un accès à AMIs ce qui a été rendu privé, vous pouvez demander l'accès en déposant un ticket auprès du AWS Support. Pour plus d'informations, consultez la section Patches du guide de EC2 l'utilisateur Amazon.

Le nœud est en `NotReady` état

Si votre nœud entre dans un NotReady état, cela indique probablement qu'il n'est pas en bon état et qu'il n'est pas disponible pour planifier de nouveaux pods. Cela peut se produire pour diverses raisons, telles que le fait que le nœud ne dispose pas de ressources suffisantes pour le processeur, la mémoire ou l'espace disque disponible.

Pour Windows optimisé pour Amazon EKS AMIs, aucune réservation n'est prévue pour les ressources de calcul spécifiées par défaut dans la kubelet configuration. Pour éviter les problèmes de ressources, vous pouvez réserver des ressources de calcul pour les processus du système en kubelet fournissant des valeurs de configuration pour Kube-reserved system-reserved. and/or Pour ce faire, utilisez le paramètre de -KubeletExtraArgs ligne de commande du script bootstrap. Pour plus d'informations, consultez la section Reserve Compute Resources for System Daemons dans la documentation Kubernetes et Paramètres de configuration du script d'amorçage dans ce guide de l'utilisateur.

Collecteur de journaux EKS

Pour résoudre les problèmes liés aux nœuds Amazon EKS, un script prédéfini est disponible sur les nœuds situés à l'adresse. /etc/eks/log-collector-script/eks-log-collector.sh Vous pouvez utiliser le script pour collecter des journaux de diagnostic pour les cas de support et le dépannage général.

Utilisez la commande suivante pour exécuter le script sur votre nœud :


sudo bash /etc/eks/log-collector-script/eks-log-collector.sh

Note

Si le script n'est pas présent à cet emplacement. Vous pouvez manuellement télécharger et exécuter le script à l'aide de la commande suivante :


curl -O https://amazon-eks.s3.amazonaws.com/support/log-collector-script/linux/eks-log-collector.sh
sudo bash eks-log-collector.sh

Le script collecte les informations de diagnostic suivantes.


$ sudo bash /etc/eks/log-collector-script/eks-log-collector.sh

      This is version 0.7.8. New versions can be found at https://github.com/awslabs/amazon-eks-ami/blob/main/log-collector-script/

Trying to collect common operating system logs...
Trying to collect kernel logs...
Trying to collect mount points and volume information...
...
...

	Done... your bundled logs are located in /var/log/eks_i-EXAMPLE_2025-03-25_0000-UTC_0.7.8.tar.gz

Les informations de diagnostic sont collectées et stockés dans :


/var/log/eks_i-EXAMPLE_2025-03-25_0000-UTC_0.7.8.tar.gz

Pour récupérer le bundle de journaux pour les nœuds Bottlerocket, reportez-vous à Bottlerocket Log pour plus de détails.

Le réseau d'exécution du conteneur n'est pas prêt

Vous pouvez recevoir une erreur Container runtime network not ready et des erreurs d'autorisation similaires aux suivantes :


4191 kubelet.go:2130] Container runtime network not ready: NetworkReady=false reason:NetworkPluginNotReady message:docker: network plugin is not ready: cni config uninitialized
4191 reflector.go:205] k8s.io/kubernetes/pkg/kubelet/kubelet.go:452: Failed to list *v1.Service: Unauthorized
4191 kubelet_node_status.go:106] Unable to register node "ip-10-40-175-122.ec2.internal" with API server: Unauthorized
4191 reflector.go:205] k8s.io/kubernetes/pkg/kubelet/kubelet.go:452: Failed to list *v1.Service: Unauthorized

Les raisons possibles sont les suivantes :

Soit vous n'en avez pas aws-auth ConfigMap sur votre cluster, soit celui-ci n'inclut pas d'entrées pour le rôle IAM avec lequel vous avez configuré vos nœuds.

Pour résoudre le problème, consultez les entrées existantes dans votre my-cluster en remplaçant la commande suivante ConfigMap par le nom de votre cluster, puis en exécutant la commande modifiée :eksctl get iamidentitymapping --cluster my-cluster. Si vous recevez un message d'erreur de la part de la commande, cela peut être dû au fait que votre cluster ne possède pas de aws-authConfigMap. La commande suivante ajoute une entrée à la ConfigMap. Si le ConfigMap n'existe pas, la commande le crée également. 111122223333Remplacez-le par l'ID de AWS compte du rôle IAM et myAmazonEKSNodeRole par le nom du rôle de votre nœud.
```
eksctl create iamidentitymapping --cluster my-cluster \
    --arn arn:aws: iam::111122223333:role/myAmazonEKSNodeRole --group system:bootstrappers,system:nodes \
    --username system:node:{{EC2PrivateDNSName}}
```
L'ARN du rôle que vous spécifiez ne peut pas inclure de chemin autre que/. Par exemple, si le nom de votre rôle estdevelopment/apps/my-role, vous devrez le remplacer my-role lorsque vous spécifiez l'ARN du rôle. Assurez-vous que vous spécifiez l'ARN pour le rôle IAM du nœud (et non l'ARN du profil d'instance).
Vos nœuds autogérés se trouvent dans un cluster dont la version de plate-forme est la version minimale répertoriée dans les conditions requises dans la rubrique Accorder aux utilisateurs IAM l'accès à Kubernetes avec des entrées d'accès EKS, mais aucune entrée n'est répertoriée dans le aws-auth ConfigMap (voir point précédent) pour le rôle IAM du nœud ou aucune entrée d'accès n'existe pour le rôle. Pour résoudre le problème, consultez vos entrées d'accès existantes my-cluster en remplaçant la commande suivante par le nom de votre cluster, puis en exécutant la commande modifiée :aws eks list-access-entries --cluster-name my-cluster. La commande suivante ajoute une entrée d'accès pour le rôle IAM du nœud. 111122223333Remplacez-le par l'ID de AWS compte du rôle IAM et myAmazonEKSNodeRole par le nom du rôle de votre nœud. Si vous possédez un nœud Windows, remplacez-le EC2_LINUX parEC2_Windows. Assurez-vous que vous spécifiez l'ARN pour le rôle IAM du nœud (et non l'ARN du profil d'instance).
```
aws eks create-access-entry --cluster-name my-cluster --principal-arn arn:aws: iam::111122223333:role/myAmazonEKSNodeRole --type EC2_LINUX
```

Délai d'expiration de la liaison TLS

Lorsqu'un nœud est incapable d'établir une connexion avec le point de terminaison du serveur d'API public, vous pouvez voir une erreur similaire à l'erreur suivante.


server.go:233] failed to run Kubelet: could not init cloud provider "aws": error finding instance i-1111f2222f333e44c: "error listing AWS instances: \"RequestError: send request failed\\ncaused by: Post  net/http: TLS handshake timeout\""

Le processus kubelet se reproduira continuellement et testera le point de terminaison du serveur d'API. L'erreur peut également se produire temporairement au cours de toute procédure qui effectue une mise à jour continue du cluster dans le plan de contrôle, telle qu'une modification de configuration ou une mise à jour de version.

Pour résoudre le problème, vérifiez la table de routage et les groupes de sécurité pour vous assurer que le trafic provenant des nœuds peut atteindre le point de terminaison public.

InvalidClientTokenId

Si vous utilisez des rôles IAM pour les comptes de service d'un pod ou si vous êtes DaemonSet déployé sur un cluster dans une AWS région de Chine, et que vous n'avez pas défini la variable d'AWS_DEFAULT_REGIONenvironnement dans la spécification, le pod ou le pod DaemonSet peut recevoir le message d'erreur suivant :


An error occurred (InvalidClientTokenId) when calling the GetCallerIdentity operation: The security token included in the request is invalid

Pour résoudre le problème, vous devez ajouter la variable d'AWS_DEFAULT_REGIONenvironnement à votre Pod ou à votre DaemonSet spécification, comme indiqué dans l'exemple de spécification de Pod suivant.


apiVersion: v1
kind: Pod
metadata:
  name: envar-demo
  labels:
    purpose: demonstrate-envars
spec:
  containers:
  - name: envar-demo-container
    image: gcr.io/google-samples/node-hello:1.0
    env:
    - name: AWS_DEFAULT_REGION
      value: "region-code"

Les groupes de nœuds doivent correspondre à la version de Kubernetes avant de mettre à niveau le plan de contrôle

Avant de mettre à niveau un plan de contrôle vers une nouvelle version de Kubernetes, la version mineure des nœuds gérés et Fargate de votre cluster doit être identique à la version actuelle de votre plan de contrôle. L'API update-cluster-version Amazon EKS rejette les demandes tant que vous n'avez pas mis à niveau tous les nœuds gérés par Amazon EKS vers la version actuelle du cluster. Amazon EKS permet APIs de mettre à niveau les nœuds gérés. Pour plus d'informations sur la mise à niveau de la version Kubernetes d'un groupe de nœuds gérés, consultez. Mettre à jour un groupe de nœuds gérés pour votre cluster Pour mettre à niveau la version d'un nœud Fargate, supprimez le pod représenté par le nœud et redéployez le pod après avoir mis à niveau votre plan de contrôle. Pour de plus amples informations, veuillez consulter Mettre à jour le cluster existant vers la nouvelle version de Kubernetes.

Lors du lancement de nombreux nœuds, des erreurs `Too Many Requests` se produisent

Si vous lancez plusieurs nœuds simultanément, un message d'erreur peut s'afficher dans les journaux d'exécution des données EC2 utilisateur d'Amazon indiquant que : Too Many Requests Cela peut se produire parce que le plan de contrôle est surchargé d'appels describeCluster. Cette surcharge se traduit par une limitation, des nœuds qui ne parviennent pas à exécuter le script d'amorçage et des nœuds qui ne parviennent pas à rejoindre le cluster.

Assurez-vous que les --dns-cluster-ip arguments --apiserver-endpoint--b64-cluster-ca, et sont transmis au script bootstrap du nœud. Lorsque vous incluez ces arguments, le script bootstrap n'a pas besoin d'effectuer un describeCluster appel, ce qui permet d'éviter une surcharge du plan de contrôle. Pour de plus amples informations, veuillez consulter Fournissez des données utilisateur pour transmettre des arguments au bootstrap.sh fichier inclus dans une Linux/Bottlerocket AMI optimisée pour Amazon EKS.

Réponse d'erreur non autorisée HTTP 401 sur les requêtes du serveur API Kubernetes

Ces erreurs s'affichent si le jeton de compte de service d'un Pod a expiré sur un cluster.

Le serveur d'API Kubernetes de votre cluster Amazon EKS rejette les demandes contenant des jetons datant de plus de 90 jours. Dans les versions précédentes de Kubernetes, les jetons n'avaient pas de période d'expiration. Cela signifie que les clients qui s'appuient sur ces jetons doivent les actualiser dans l'heure. Pour empêcher le serveur d'API Kubernetes de rejeter votre demande en raison d'un jeton non valide, la version du SDK client Kubernetes utilisée par votre charge de travail doit être identique ou ultérieure aux versions suivantes :

Go version 0.15.7 et ultérieure
Python version 12.0.0 et ultérieure
Java version 9.0.0 et ultérieure
JavaScript version 0.10.3 et versions ultérieures
Branche master Ruby
Haskell version 0.3.0.0
Version C# 7.0.5 et versions ultérieures

Vous pouvez identifier tous les pods existants de votre cluster qui utilisent des jetons périmés. Pour de plus amples informations, veuillez consulter Jetons de compte de service.

La version de la plateforme Amazon EKS est inférieure de plus de deux versions à la version actuelle de la plateforme

Cela peut se produire lorsqu'Amazon EKS n'est pas en mesure de mettre à jour automatiquement la version de la plateforme de votre cluster. Bien qu'il existe de nombreuses causes à cela, certaines des causes les plus courantes suivent. Si l'un de ces problèmes s'applique à votre cluster, il est possible qu'il fonctionne toujours, mais la version de sa plateforme ne sera tout simplement pas mise à jour par Amazon EKS.

Problème

Le Rôle IAM du cluster a été supprimé : ce rôle a été spécifié lors de la création du cluster. Vous pouvez voir quel rôle a été spécifié à l'aide de la commande suivante. Remplacez my-cluster par le nom de votre cluster.


aws eks describe-cluster --name my-cluster --query cluster.roleArn --output text | cut -d / -f 2

L'exemple qui suit illustre un résultat.


eksClusterRole

Solution

Création d'un nouveau rôle IAM du cluster portant le même nom.

Problème

Un sous-réseau spécifié lors de la création du cluster a été supprimé : les sous-réseaux à utiliser avec le cluster ont été spécifiés lors de la création du cluster. Vous pouvez voir quels sous-réseaux ont été spécifiés à l'aide de la commande suivante. Remplacez my-cluster par le nom de votre cluster.


aws eks describe-cluster --name my-cluster --query cluster.resourcesVpcConfig.subnetIds

L'exemple qui suit illustre un résultat.


[
"subnet-EXAMPLE1",
"subnet-EXAMPLE2"
]

Solution

Vérifiez si le sous-réseau IDs existe dans votre compte.


vpc_id=$(aws eks describe-cluster --name my-cluster --query cluster.resourcesVpcConfig.vpcId --output text)
aws ec2 describe-subnets --filters "Name=vpc-id,Values=$vpc_id" --query "Subnets[*].SubnetId"

L'exemple qui suit illustre un résultat.


[
"subnet-EXAMPLE3",
"subnet-EXAMPLE4"
]

Si le sous-réseau IDs renvoyé dans la sortie ne correspond pas au sous-réseau spécifié lors de la création du cluster, si vous souhaitez IDs qu'Amazon EKS mette à jour le cluster, vous devez modifier les sous-réseaux utilisés par le cluster. En effet, si vous avez spécifié plus de deux sous-réseaux lors de la création de votre cluster, Amazon EKS sélectionne de manière aléatoire les sous-réseaux que vous avez spécifiés pour y créer de nouvelles interfaces réseau Elastic. Ces interfaces réseau permettent au plan de contrôle de communiquer avec vos nœuds. Amazon EKS ne mettra pas à jour le cluster si le sous-réseau sélectionné n'existe pas. Vous n'avez aucun contrôle sur les sous-réseaux que vous avez spécifiés lors de la création du cluster dans lesquels Amazon EKS choisit de créer une nouvelle interface réseau.

Lorsque vous lancez une mise à jour de version de Kubernetes pour votre cluster, la mise à jour peut échouer pour la même raison.

Problème

Un groupe de sécurité spécifié lors de la création du cluster a été supprimé : si vous avez spécifié des groupes de sécurité lors de la création du cluster, vous pouvez les voir à l' IDs aide de la commande suivante. Remplacez my-cluster par le nom de votre cluster.


aws eks describe-cluster --name my-cluster --query cluster.resourcesVpcConfig.securityGroupIds

L'exemple qui suit illustre un résultat.


[
    "sg-EXAMPLE1"
]

Si elle [] est renvoyée, aucun groupe de sécurité n'a été spécifié lors de la création du cluster et aucun groupe de sécurité manquant n'est à l'origine du problème. Si des groupes de sécurité sont renvoyés, vérifiez qu'ils existent dans votre compte.

Solution

Vérifiez si ces groupes de sécurité existent dans votre compte.


vpc_id=$(aws eks describe-cluster --name my-cluster --query cluster.resourcesVpcConfig.vpcId --output text)
aws ec2 describe-security-groups --filters "Name=vpc-id,Values=$vpc_id" --query "SecurityGroups[*].GroupId"

L'exemple qui suit illustre un résultat.


[
"sg-EXAMPLE2"
]

Si le groupe de sécurité IDs renvoyé dans la sortie ne correspond pas au groupe de sécurité spécifié lors de la création du cluster, si vous souhaitez IDs qu'Amazon EKS mette à jour le cluster, vous devez modifier les groupes de sécurité utilisés par le cluster. Amazon EKS ne met pas à jour un cluster si le groupe de sécurité IDs spécifié lors de la création du cluster n'existe pas.

Lorsque vous lancez une mise à jour de version de Kubernetes pour votre cluster, la mise à jour peut échouer pour la même raison.

Vous n'avez pas au moins six (mais nous recommandons 16) adresses IP disponibles dans chacun des sous-réseaux que vous avez spécifiés lors de la création de votre cluster. Si vous n'avez pas suffisamment d'adresses IP disponibles dans le sous-réseau, vous devez soit libérer des adresses IP dans le sous-réseau, soit modifier les sous-réseaux utilisés par le cluster pour utiliser des sous-réseaux avec suffisamment d'adresses IP disponibles.
Vous avez activé le chiffrement secret lorsque vous avez créé votre cluster et la clé AWS KMS que vous avez spécifiée a été supprimée. Si vous souhaitez qu'Amazon EKS mette à jour le cluster, vous devez créer un nouveau cluster

Codes d'erreur FAQs et d'intégrité du cluster avec chemins de résolution

Amazon EKS détecte les problèmes liés à vos clusters EKS et à l'infrastructure du cluster et les stocke dans l'objet d'état de la ressource de votre cluster EKS. Vous pouvez détecter et résoudre les problèmes de cluster plus rapidement à l'aide des informations relatives à l'état du cluster. Cela vous permet de créer des environnements d'applications plus sécurisés et up-to-date. En outre, il peut s'avérer impossible pour vous de passer à des versions plus récentes de Kubernetes ou pour Amazon EKS d'installer des mises à jour de sécurité sur un cluster dégradé en raison de problèmes liés à l'infrastructure ou à la configuration du cluster nécessaires. Amazon EKS peut mettre 3 heures pour détecter les problèmes ou détecter qu'un problème est résolu.

La santé d'un cluster Amazon EKS est une responsabilité partagée entre Amazon EKS et ses utilisateurs. Vous êtes responsable de l'infrastructure préalable des rôles IAM et des sous-réseaux Amazon VPC, ainsi que des autres infrastructures nécessaires, qui doivent être fournies à l'avance. Amazon EKS détecte les modifications apportées à la configuration de cette infrastructure et du cluster.

Pour accéder à l'état de santé de votre cluster dans la console Amazon EKS, recherchez un tableau intitulé Problèmes de santé dans l'onglet Problèmes de santé du cluster du tableau de bord d'observabilité accessible depuis la page détaillée du cluster Amazon EKS. Ces données seront également disponibles en appelant l'DescribeClusteraction dans l'API EKS, par exemple depuis l'interface de ligne de AWS commande.

Pourquoi utiliser cette fonctionnalité ?: Vous bénéficierez d'une visibilité accrue sur l'état de santé de votre cluster Amazon EKS, diagnostiquerez et résoudrez rapidement les problèmes, sans avoir à passer du temps à déboguer ou à ouvrir des dossiers de AWS support. Par exemple : vous avez accidentellement supprimé un sous-réseau pour le cluster Amazon EKS, Amazon EKS ne sera pas en mesure de créer des interfaces réseau entre comptes et des commandes de la AWS CLI Kubernetes kubectl telles que exec ou logs. kubectl L'erreur suivante s'affiche : Error from server: error dialing backend: remote error: tls: internal error. Le problème d'état Amazon EKS indique : subnet-da60e280 was deleted: could not create network interface.
Comment cette fonctionnalité est-elle liée ou fonctionne-t-elle avec d'autres AWS services ?: Les rôles IAM et les sous-réseaux Amazon VPC sont deux exemples d'infrastructure préalable avec laquelle l'état du cluster détecte les problèmes. Cette fonctionnalité renvoie des informations détaillées si ces ressources ne sont pas correctement configurées.
Un cluster présentant des problèmes de santé est-il payant ?: Oui, chaque cluster Amazon EKS est facturé au tarif standard d'Amazon EKS. La fonctionnalité liée à l'état du cluster est disponible sans frais supplémentaires.
Cette fonctionnalité fonctionne-t-elle avec les clusters Amazon EKS sur AWS Outposts ?: Oui, des problèmes de cluster sont détectés pour les clusters EKS dans le AWS cloud, y compris les clusters étendus sur les AWS Outposts et les clusters locaux sur les AWS Outposts. L'état du cluster ne détecte pas les problèmes liés à Amazon EKS Anywhere ou Amazon EKS Distro (EKS-D).
Puis-je être averti lorsque de nouveaux problèmes sont détectés ?: Oui AWS envoie un e-mail et une notification au Personal Health Dashboard lorsque de nouveaux problèmes de santé du cluster sont détectés.
La console m'avertit-elle en cas de problème de santé ?: Oui, tout cluster présentant des problèmes d'état présentera une bannière en haut de la console.

Les deux premières colonnes sont celles qui sont nécessaires pour les valeurs de réponse de l'API. Le troisième champ de l' ClusterIssueobjet Health est ResourceIds, dont le retour dépend du type de problème.

Code	Message	ResourceIds	Le cluster est-il récupérable ?
SOUS-RÉSEAU NON TROUVÉ	Nous n'avons pas pu trouver un ou plusieurs sous-réseaux actuellement associés à votre cluster. Appelez l'API update-cluster-config Amazon EKS pour mettre à jour les sous-réseaux.	ID de sous-réseaux	Oui
GROUPE_DE SÉCURITÉ INTROUVABLE	Nous n'avons pas trouvé un ou plusieurs groupes de sécurité actuellement associés à votre cluster. Appelez l' update-cluster-configAPI Amazon EKS pour mettre à jour les groupes de sécurité	ID de groupe de sécurité	Oui
IP NON DISPONIBLE	Un ou plusieurs sous-réseaux associés à votre cluster ne disposent pas d'un nombre suffisant d'adresses IP pour qu'Amazon EKS puisse effectuer des opérations de gestion de cluster. Libérez des adresses dans le ou les sous-réseaux ou associez différents sous-réseaux à votre cluster à l'aide de l'API Amazon EKS update-cluster-config.	ID de sous-réseaux	Oui
VPC_INTROUVABLE	Nous n'avons pas trouvé le VPC associé à votre cluster. Vous devez supprimer et recréer votre cluster.	ID du VPC	Non
ASSUME_ROLE_ACCESS_DENIED	Votre cluster n'utilise pas Amazon EKS service-linked-role. Nous ne pouvions pas assumer le rôle associé à votre cluster pour effectuer les opérations de gestion Amazon EKS requises. Vérifiez que le rôle existe et qu'il dispose de la politique de confiance requise.	Rôle IAM du cluster	Oui
AUTORISATION D'ACCÈS REFUSÉE	Votre cluster n'utilise pas Amazon EKS service-linked-role. Le rôle associé à votre cluster n'accorde pas les autorisations suffisantes à Amazon EKS pour effectuer les opérations de gestion requises. Vérifiez les politiques associées au rôle de cluster et si des politiques de refus distinctes sont appliquées.	Rôle IAM du cluster	Oui
ASSUME_ROLE_ACCESS_DENIED_USING_SLR	Nous ne pouvions pas assumer la gestion du cluster Amazon EKS service-linked-role. Vérifiez que le rôle existe et qu'il dispose de la politique de confiance requise.	L'Amazon EKS service-linked-role	Oui
AUTORISATION D'ACCÈS REFUSÉE À L'AIDE DE SLR	La gestion du cluster Amazon EKS service-linked-role n'accorde pas d'autorisations suffisantes à Amazon EKS pour effectuer les opérations de gestion requises. Vérifiez les politiques associées au rôle de cluster et si des politiques de refus distinctes sont appliquées.	L'Amazon EKS service-linked-role	Oui
OPT_IN_OBLIGATOIRE	Aucun abonnement au EC2 service Amazon n'est associé à votre compte. Mettez à jour les abonnements de votre compte sur la page des paramètres de votre compte.	N/A	Oui
STS_REGIONAL_ENDPOINT_DISABLED	Le point de terminaison régional STS est désactivé. Activez le point de terminaison pour qu'Amazon EKS effectue les opérations de gestion de cluster requises.	N/A	Oui
KMS_KEY_DISABLED	La clé AWS KMS associée à votre cluster est désactivée. Réactivez la clé pour récupérer votre cluster.	Le porte-clés KMS	Oui
KMS_KEY_NOT_FOUND	Nous n'avons pas trouvé la clé AWS KMS associée à votre cluster. Vous devez supprimer et recréer le cluster.	L'ARN de la clé KMS	Non
KMS_GRANT_RÉVOQUÉ	Les autorisations pour la clé AWS KMS associée à votre cluster sont révoquées. Vous devez supprimer et recréer le cluster.	Le porte-clés KMS	Non

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Versions de plateforme

Projets liés à Amazon EKS