Configurazione delle reti - Amazon EMR

Configurazione delle reti

La maggior parte dei cluster viene avviata in una rete virtuale utilizzando Amazon Virtual Private Cloud (Amazon VPC). Un VPC è una rete virtuale isolata all'interno di AWS che è logicamente isolata all'interno dell'account AWS. È possibile configurare aspetti quali gli intervalli di indirizzi IP privati, le sottoreti, le tabelle di routing e i gateway di rete. Per ulteriori informazioni, consulta la Guida per l'utente di Amazon VPC.

VPC offre le seguenti caratteristiche:

  • Elaborazione di dati sensibili

    L'avvio di un cluster in un VPC è simile all'avvio del cluster in una rete privata con strumenti aggiuntivi, ad esempio tabelle di routing e liste di controllo degli accessi di rete, per definire chi può accedere alla rete. Se si stanno elaborando dati sensibili nel cluster, potrebbe essere necessario il controllo degli accessi aggiuntivo fornito dall'avvio del cluster in un VPC. Inoltre, puoi scegliere di avviare le risorse in una sottorete privata in cui nessuna di tali risorse dispone di una connessione a Internet diretta.

  • Accesso alle risorse su una rete interna

    Se l'origine dati si trova in una rete privata, potrebbe essere difficile o non opportuno caricare tali dati in AWS per l'importazione in Amazon EMR, a causa della quantità di dati da trasferire o della natura riservata dei dati. Invece, puoi avviare il cluster in un VPC e collegare il data center al VPC tramite una connessione VPN, consentendo al cluster di accedere a risorse sulla rete interna. Ad esempio, se nel data center è disponibile un database Oracle, l'avvio del cluster in un VPC connesso a tale rete tramite VPN consente al cluster di accedere al database Oracle.

Sottoreti pubbliche e private

Puoi avviare cluster Amazon EMR in sottoreti VPC pubbliche e private. Ciò significa che non occorre una connessione a Internet per eseguire un cluster Amazon EMR; tuttavia, potrebbe essere necessario configurare Network Address Translation (NAT) e gateway VPN per accedere a servizi o risorse che si trovano all'esterno del VPC, ad esempio in una intranet aziendale o endpoint dei servizi AWS pubblici, come AWS Key Management Service.

Importante

Amazon EMR supporta solo l'avvio di cluster in sottoreti private nelle versioni 4.2 e successive.

Per ulteriori informazioni su Amazon VPC, consulta la Guida per l'utente di Amazon VPC.

Più risorse per l'approfondimento della conoscenza di VPC

Utilizza gli argomenti seguenti per avere ulteriori informazioni sui VPC e sulle sottoreti.