Configurazione della visualizzazione coerente - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Configurazione della visualizzazione coerente

Puoi configurare ulteriori impostazioni per la visualizzazione coerente fornendole mediante le proprietà di configurazione emrfs-site. Ad esempio, puoi scegliere una velocità effettiva DynamoDB predefinita differente fornendo gli argomenti seguenti all'opzione della CLI --emrfs, utilizzando la classificazione di configurazione emrfs-site (solo Amazon EMR versione 4.x e versioni successive) o un'operazione di bootstrap per configurare il file emrfs-site.xml sul nodo master:

Esempio Modifica dei valori di lettura e scrittura dei metadati di default all'avvio del cluster
aws emr create-cluster --release-label emr-7.1.0 --instance-type m5.xlarge \ --emrfs Consistent=true,Args=[fs.s3.consistent.metadata.read.capacity=600,\ fs.s3.consistent.metadata.write.capacity=300] --ec2-attributes KeyName=myKey

In alternativa, puoi utilizzare il file di configurazione seguente e salvarlo in locale o in Amazon S3:

[ { "Classification": "emrfs-site", "Properties": { "fs.s3.consistent.metadata.read.capacity": "600", "fs.s3.consistent.metadata.write.capacity": "300" } } ]

Utilizza la configurazione creata con la sintassi seguente:

aws emr create-cluster --release-label emr-7.1.0 --applications Name=Hive \ --instance-type m5.xlarge --instance-count 2 --configurations file://./myConfig.json
Nota

I caratteri di continuazione della riga Linux (\) sono inclusi per la leggibilità. Possono essere rimossi o utilizzati nei comandi Linux. Per Windows, rimuoverli o sostituirli con un accento circonflesso (^).

Le seguenti opzioni possono essere impostate utilizzando configurazioni o argomenti. AWS CLI --emrfs Per informazioni su questi argomenti, consulta la Guida di riferimento ai comandi della AWS CLI.

Proprietà emrfs-site.xml per la visualizzazione coerente
Proprietà Valore predefinito Descrizione
fs.s3.consistent false

Quando impostata su true, questa proprietà configura EMRFS per utilizzare DynamoDB per fornire consistenza.

fs.s3.consistent.retryPolicyType exponential Questa proprietà identifica la policy da utilizzare quando si effettua un nuovo tentativo per i problemi di consistenza. Le opzioni includono: exponential, fixed o none.
fs.s3.consistent.retryPeriodSeconds 1 Questa proprietà imposta l'intervallo di attesa tra i tentativi di consistenza.
fs.s3.consistent.retryCount 10 Questa proprietà imposta il numero massimo di tentativi quando viene rilevata un'inconsistenza.
fs.s3.consistent.throwExceptionOnInconsistency true Questa proprietà determina se generare o registrare un'eccezione di consistenza. Quando impostata su true, viene generata un'eccezione ConsistencyException.
fs.s3.consistent.metadata.autoCreate true Quando impostata su true, questa proprietà attiva la creazione automatica delle tabelle di metadati.
fs.s3.consistent.metadata.etag.verification.enabled true Con Amazon EMR 5.29.0, questa proprietà è abilitata per impostazione predefinita. Quando abilitato, EMRFS utilizza gli ETag S3 per verificare che gli oggetti letti siano la versione più recente disponibile. Questa funzione è utile nei casi d' read-after-update uso in cui i file su S3 vengono sovrascritti mantenendo lo stesso nome. Questa caratteristica di verifica ETag attualmente non funziona con S3 Select.
fs.s3.consistent.metadata.tableName EmrFSMetadata Questa proprietà specifica il nome della tabella di metadati in DynamoDB.
fs.s3.consistent.metadata.read.capacity 500 Questa proprietà specifica la capacità di lettura di DynamoDB per effettuare il provisioning quando viene creata la tabella di metadati.
fs.s3.consistent.metadata.write.capacity 100 Questa proprietà specifica la capacità di scrittura di DynamoDB per effettuare il provisioning quando viene creata la tabella di metadati.
fs.s3.consistent.fastList true Quando impostata su true, questa proprietà utilizza più thread per elencare una directory (quando necessario). La consistenza deve essere attivata per utilizzare questa proprietà.
fs.s3.consistent.fastList.prefetchMetadata false Quando impostata su true, questa proprietà attiva il recupero dei metadati per le directory contenenti più di 20.000 elementi.
fs.s3.consistent.notification.CloudWatch false Se impostato sutrue, i CloudWatch parametri sono abilitati per le chiamate FileSystem API che non riescono a causa di eventuali problemi di coerenza di Amazon S3.
fs.s3.consistent.notification.SQS false Quando impostate su true, le notifiche di consistenza finale sono trasmesse a una coda Amazon SQS.
fs.s3.consistent.notification.SQS.queueName EMRFS-Inconsistency-<jobFlowId> La modifica di questa proprietà consente di specificare il nome della coda SQS per i messaggi relativi ai problemi di consistenza finale di Amazon S3.
fs.s3.consistent.notification.SQS.customMsg none Questa proprietà consente di specificare informazioni personalizzate incluse in messaggi SQS relativi ai problemi di consistenza finale di Amazon S3. Se un valore non è specificato per questa proprietà, il campo corrispondente nel messaggio è vuoto.
fs.s3.consistent.dynamodb.endpoint none Questa proprietà consente di specificare un endpoint DynamoDB personalizzato per i metadati della visualizzazione coerente.
fs.s3.useRequesterPaysHeader false Quando è impostato su true, questa proprietà consente alle richieste Amazon S3 ai bucket con l'opzione del entità pagante delle richieste abilitata.