Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Configuration de rôles IAM pour les demandes EMRFS à Amazon S3
Note
La fonctionnalité de mappage de rôle EMRFS présentée sur cette page a été améliorée avec l’introduction d’Amazon S3 Access Grants dans Amazon EMR 6.15.0. Pour une solution de contrôle d’accès évolutive pour vos données dans Amazon S3, nous vous recommandons d’utiliser S3 Access Grants avec Amazon EMR.
Lorsqu'une application s'exécutant sur un cluster référence des données à l'aide du format s3://
, Amazon EMR utilise EMRFS pour effectuer la demande. Pour interagir avec Amazon S3, EMRFS applique les politiques d'autorisation associées à votre profil d' EC2 instance Amazon. Le même profil d' EC2 instance Amazon est utilisé quel que soit l'utilisateur ou le groupe exécutant l'application ou l'emplacement des données dans Amazon S3. mydata
Si vous avez un cluster avec plusieurs utilisateurs qui ont besoin de différents niveaux d'accès aux données dans Amazon S3 via EMRFS, vous pouvez définir une configuration de sécurité avec des rôles IAM pour EMRFS. EMRFS peut assumer un rôle de service différent pour les EC2 instances de cluster en fonction de l'utilisateur ou du groupe qui fait la demande, ou en fonction de l'emplacement des données dans Amazon S3. Chaque rôle IAM pour EMRFS peut avoir des autorisations différentes pour l'accès aux données dans Amazon S3. Pour plus d'informations sur le rôle de service des EC2 instances de cluster, consultezRôle de service pour les EC2 instances de cluster (profil d'EC2instance).
L'utilisation de rôles IAM personnalisés pour EMRFS est prise en charge dans les versions 5.10.0 et ultérieures d'Amazon EMR. Si vous utilisez une version précédente ou si vous avez d'autres exigences en matière d'autorisation au-delà de ce que proposent les rôles IAM pour EMRFS, vous pouvez créer un fournisseur d'informations d'identification personnalisées à la place. Pour plus d'informations, consultez Autorisation d'accès aux données EMRFS dans Amazon S3.
Lorsque vous utilisez une configuration de sécurité pour spécifier des rôles IAM pour EMRFS, vous définissez des mappages de rôle. Chaque mappage de rôle spécifie un rôle IAM qui correspond aux identifiants. Ces identifiants déterminent la base pour accéder à Amazon S3 via EMRFS. Les identifiants peuvent être des utilisateurs, des groupes ou des préfixes Amazon S3 qui indiquent un emplacement de données. Lorsqu'EMRFS envoie une demande à Amazon S3, si la demande correspond à la base d'accès, EMRFS fait en sorte que les EC2 instances de cluster assument le rôle IAM correspondant à la demande. Les autorisations IAM associées à ce rôle s'appliquent à la place des autorisations IAM associées au rôle de service pour les instances de cluster EC2 .
Les utilisateurs et les groupes dans un mappage de rôle sont des utilisateurs et des groupes Hadoop qui sont définis sur le cluster. Les utilisateurs et les groupes sont transmis à EMRFS dans le cadre de l'application à l'aide de celle-ci (par exemple, un emprunt d'identité de l'utilisateur YARN). Le préfixe Amazon S3 peut être un spécificateur de compartiment de quelque profondeur que ce soit (par exemple, s3://amzn-s3-demo-bucket
ou s3://amzn-s3-demo-bucket/myproject/mydata
). Vous pouvez spécifier plusieurs identificateurs au sein d'un même mappage de rôle, mais ils doivent tous être du même type.
Important
Les rôles IAM pour EMRFS fournissent un isolement au niveau de l'application entre les utilisateurs de l'application. Ils ne fournissent pas d'isolement au niveau de l'hôte entre les utilisateurs sur l'hôte. Tout utilisateur ayant accès au cluster peut contourner l'isolement pour assumer l'un de ces rôles.
Lorsqu'une application de cluster envoie une demande à Amazon S3 via EMRFS, EMRFS évalue les mappages de rôle dans l'ordre descendant dans lequel ils s'affichent dans la configuration de sécurité. Si une demande effectuée via EMRFS ne correspond à aucun identifiant, EMRFS utilise à nouveau le rôle de service pour les instances de cluster. EC2 Pour cette raison, nous recommandons que les stratégies attachées à ce rôle limitent les autorisations pour Amazon S3. Pour de plus amples informations, veuillez consulter Rôle de service pour les EC2 instances de cluster (profil d'EC2instance).
Configuration des rôles
Avant de définir une configuration de sécurité avec des rôles IAM pour EMRFS, planifiez et créez les rôles et les stratégies d'autorisation à attacher aux rôles. Pour plus d'informations, consultez Comment fonctionnent les rôles pour EC2 les instances ? dans le guide de l'utilisateur IAM. Lorsque vous créez des politiques d'autorisation, nous vous recommandons de commencer par la politique gérée associée au rôle Amazon EMR par défaut pour EC2, puis de modifier cette politique en fonction de vos besoins. Le nom du rôle par défaut est EMR_EC2_DefaultRole
et la stratégie gérée pour modifier la valeur par défaut est AmazonElasticMapReduceforEC2Role
. Pour de plus amples informations, veuillez consulter Rôle de service pour les EC2 instances de cluster (profil d'EC2instance).
Mise à jour des politiques d'approbation pour prendre en charge les autorisations de rôle
Chaque rôle utilisé par EMRFS doit avoir une politique de confiance qui autorise le rôle Amazon EMR du cluster à l'assumer EC2 . De même, le rôle Amazon EMR du cluster pour EC2 doit disposer d'une politique de confiance qui autorise les rôles EMRFS à l'assumer.
L'exemple de stratégie d'approbation suivant est attaché à des rôles pour EMRFS. L'instruction autorise le rôle Amazon EMR par défaut EC2 à assumer ce rôle. Par exemple, si vous avez deux rôles EMRFS fictifs, EMRFSRole_First
et EMRFSRole_Second
, cette déclaration de stratégie est ajoutée à la stratégie d'approbation des stratégies pour chacun d'entre eux.
{ "Version":"2012-10-17", "Statement":[ { "Effect":"Allow", "Principal":{ "AWS":"arn:aws:iam::
AWSAcctID
:role/EMR_EC2_DefaultRole" }, "Action":"sts:AssumeRole" } ] }
De plus, l'exemple de déclaration de stratégie d'approbation suivant est ajouté à EMR_EC2_DefaultRole
pour autoriser les deux rôles EMRFS fictifs à l'assumer.
{ "Version":"2012-10-17", "Statement":[ { "Effect":"Allow", "Principal":{ "AWS": ["arn:aws:iam::
AWSAcctID
:role/EMRFSRole_First
", "arn:aws:iam::AWSAcctID
:role/EMRFSRole_Second
"] }, "Action":"sts:AssumeRole" } ] }
Pour mettre à jour la stratégie d'approbation d'un rôle IAM
Ouvrez la console IAM à l'adresse https://console.aws.amazon.com/iam/
-
Choisissez Rôles, saisissez le nom du rôle dans Search (Rechercher), puis sélectionnez Role name (Nom de rôle).
-
Choisissez Relations d'approbation, Modifier la relation d'approbation.
-
Ajouter une instruction d'approbation en fonction du Document de stratégie, conformément aux directives ci-dessus, puis choisissez Mettre à jour la stratégie de confiance.
Spécification d'un rôle en tant qu'utilisateur de la clé
Si un rôle permet d'accéder à un emplacement dans Amazon S3 qui est chiffré à l'aide d'une AWS KMS key, assurez-vous que le rôle est spécifié en tant qu'utilisateur clé. Cela donne au rôle l'autorisation d'utiliser la clé KMS. Pour plus d’informations, consultez Politiques de clé dans AWS KMS dans le Guide du développeur AWS Key Management Service .
Définition d'une configuration de sécurité avec des rôles IAM pour EMRFS
Important
Si aucun des rôles IAM pour EMRFS que vous spécifiez ne s'applique, EMRFS revient au rôle Amazon EMR correspondant à. EC2 Pensez à personnaliser ce rôle pour limiter les autorisations à Amazon S3 en fonction des besoins de votre application, puis spécifiez ce rôle personnalisé au lieu de EMR_EC2_DefaultRole
lorsque vous créez un cluster. Pour plus d’informations, consultez Personnalisez les rôles IAM avec Amazon EMR et Spécifiez les rôles IAM personnalisés lors de la création d'un cluster.
Pour spécifier les rôles IAM pour les demandes EMRFS dans Amazon S3 à l'aide de la console
-
Créez une configuration de sécurité qui spécifie les mappages de rôle :
-
Dans la console Amazon EMR, sélectionnez Configurations de sécurité, Créer.
-
Dans Name (Nom), saisissez un nom pour la configuration de sécurité. Ce nom est utilisé pour spécifier la configuration de sécurité lorsque vous créez un cluster.
-
Choisissez Utiliser des rôles IAM pour les demandes EMRFS à Amazon S3.
-
Sélectionnez un rôle IAM à appliquer, puis, sous Base pour l'accès, sélectionnez un type d'identifiant (Utilisateurs, Groupes ou Préfixes S3) dans la liste et entrez les identifiants correspondants. Si vous utilisez plusieurs identifiants, séparez-les par une virgule sans insérer d'espace. Pour plus d'informations sur chaque type d'identifiant, consultez la JSON configuration reference ci-dessous.
-
Choisissez Add role (Ajouter un rôle) pour configurer des mappages de rôle supplémentaires, comme décrit à l'étape précédente.
-
Définissez les autres options de la configuration de sécurité selon vos besoins et choisissez Create (Créer). Pour de plus amples informations, veuillez consulter Créez une configuration de sécurité à l'aide de la console Amazon EMR ou du AWS CLI.
-
-
Spécifiez la configuration de sécurité créée précédemment lorsque vous créez un cluster. Pour de plus amples informations, veuillez consulter Spécifier une configuration de sécurité pour un cluster Amazon EMR.
Pour spécifier les rôles IAM pour les demandes EMRFS adressées à Amazon S3 à l'aide du AWS CLI
-
Utilisez la commande
aws emr create-security-configuration
, en spécifiant un nom pour la configuration de sécurité et les détails de la configuration de sécurité au format JSON.L'exemple de commande ci-dessous crée une configuration de sécurité nommée
EMRFS_Roles_Security_Configuration
. Elle est basée sur une structure JSON dans le fichierMyEmrfsSecConfig.json
, qui est enregistré dans le répertoire où la commande est exécutée.aws emr create-security-configuration --name
EMRFS_Roles_Security_Configuration
--security-configurationfile://MyEmrFsSecConfig.json
.Utilisez les instructions suivantes pour la structure du fichier
MyEmrFsSecConfig.json
. Vous pouvez spécifier cette structure en même temps que les structures pour d'autres options de la configuration de sécurité. Pour de plus amples informations, veuillez consulter Créez une configuration de sécurité à l'aide de la console Amazon EMR ou du AWS CLI.Vous trouverez ci-dessous un exemple d'extrait JSON permettant de spécifier des rôles IAM personnalisés pour EMRFS dans une configuration de sécurité. Il montre les mappages de rôles pour les trois types d'identifiants différents, suivis d'une référence de paramètre.
{ "AuthorizationConfiguration": { "EmrFsConfiguration": { "RoleMappings": [{ "Role": "
arn:aws:iam::123456789101:role/allow_EMRFS_access_for_user1
", "IdentifierType": "User", "Identifiers": [ "user1
" ] },{ "Role": "arn:aws:iam::123456789101:role/allow_EMRFS_access_to_demo_s3_buckets
", "IdentifierType": "Prefix", "Identifiers": [ "s3://amzn-s3-demo-bucket1/","s3://amzn-s3-demo-bucket2/
" ] },{ "Role": "arn:aws:iam::123456789101:role/allow_EMRFS_access_for_AdminGroup
", "IdentifierType": "Group", "Identifiers": [ "AdminGroup
" ] }] } } }Paramètre Description "AuthorizationConfiguration":
Obligatoire.
"EmrFsConfiguration":
Obligatoire. Contient des mappages de rôles.
"RoleMappings":
Obligatoire. Contient une ou plusieurs définitions de mappage de rôles. Les mappages de rôles sont évalués dans l'ordre d'apparition du haut vers le bas. Si un mappage de rôle est considéré comme vrai pour un appel de données EMRFS dans Amazon S3, aucun autre mappage de rôle n'est évalué et EMRFS utilise le rôle IAM spécifié pour la demande. Les mappages de rôles sont constitués des paramètres obligatoires suivants :
"Role":
Spécifie l'identifiant ARN d'un rôle IAM au format
arn:aws:iam::
. Il s'agit du rôle IAM assumé par Amazon EMR si la demande EMRFS envoyée à Amazon S3 correspond à l'une desaccount-id
:role/role-name
Identifiers
spécifiées."IdentifierType":
Les valeurs suivantes sont possibles :
"User"
indique que les identifiants sont ceux d'un ou de plusieurs utilisateurs Hadoop, qui peuvent être des utilisateurs de comptes Linux ou des utilisateurs principaux de Kerberos. Lorsque la demande EMRFS provient de l'utilisateur ou des utilisateurs spécifiés, le rôle IAM est assumé."Prefix"
indique que l'identifiant est un emplacement Amazon S3. Le rôle IAM est assumé pour les appels vers le ou les emplacements dotés des préfixes spécifiés. Par exemple, le préfixes3://amzn-s3-demo-bucket/
correspond às3://amzn-s3-demo-bucket/mydir
ets3://amzn-s3-demo-bucket/yetanotherdir
."Group"
indique que les identifiants sont un ou plusieurs groupes Hadoop. Le rôle IAM est assumé si la demande provient d'un utilisateur appartenant à un ou plusieurs groupes spécifiés.
"Identifiers":
Spécifie un ou plusieurs identifiants du type d'identifiant approprié. Séparez les identifiants multiples par des virgules sans espace.
-
Utilisez la commande
aws emr create-cluster
pour créer un cluster et spécifiez la configuration de sécurité créée à l'étape précédente.L'exemple suivant crée un cluster avec les principales applications Hadoop par défaut installées. Le cluster utilise la configuration de sécurité créée ci-dessus
EMRFS_Roles_Security_Configuration
et utilise également un rôle Amazon EMR personnalisé pour EC2EC2_Role_EMR_Restrict_S3
, qui est spécifié à l'aide de l'InstanceProfile
argument du--ec2-attributes
paramètre.Note
Les caractères de continuation de ligne Linux (\) sont inclus pour des raisons de lisibilité. Ils peuvent être supprimés ou utilisés dans les commandes Linux. Pour Windows, supprimez-les ou remplacez-les par un caret (^).
aws emr create-cluster --name
MyEmrFsS3RolesCluster
\ --release-labelemr-7.6.0
--ec2-attributes InstanceProfile=EC2_Role_EMR_Restrict_S3
,KeyName=MyKey
\ --instance-typem5.xlarge
--instance-count3
\ --security-configurationEMRFS_Roles_Security_Configuration