Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Deduplicazione dei dati
I set di dati di grandi dimensioni spesso contengono dati ridondanti, il che aumenta i costi di archiviazione dei dati. Ad esempio, con le condivisioni di file utente, più utenti possono archiviare più copie o versioni dello stesso file. Con le condivisioni di sviluppo software, molti file binari rimangono invariati da una build all'altra.
È possibile ridurre i costi di archiviazione dei dati attivando la deduplicazione dei dati per il file system. La deduplicazione dei dati riduce o elimina i dati ridondanti archiviando parti duplicate del set di dati una sola volta. La compressione dei dati è abilitata per impostazione predefinita quando si utilizza la deduplicazione dei dati, riducendo ulteriormente la quantità di archiviazione dei dati comprimendo i dati dopo la deduplicazione. La deduplicazione dei dati viene eseguita come un processo in background che analizza e ottimizza continuamente e automaticamente il file system ed è trasparente per gli utenti e i client connessi.
I risparmi di storage che è possibile ottenere con la deduplicazione dei dati dipendono dalla natura del set di dati, inclusa la quantità di duplicazione esistente tra i file. I risparmi tipici sono in media del 50-60% per le condivisioni di file per uso generico. Nell'ambito delle azioni, i risparmi vanno dal 30 al 50 percento per i documenti degli utenti al 70-80 percento per i set di dati di sviluppo software. È possibile misurare i potenziali risparmi derivanti dalla deduplicazione utilizzando il comando descritto di seguito. Measure-FSxDedupFileMetadata
È inoltre possibile personalizzare la deduplicazione dei dati per soddisfare esigenze di storage specifiche. Ad esempio, è possibile configurare la deduplicazione in modo che venga eseguita solo su determinati tipi di file oppure è possibile creare una pianificazione dei processi personalizzata. Poiché i processi di deduplicazione possono consumare risorse del file server, si consiglia di monitorare lo stato dei processi di deduplicazione utilizzando il comando descritto di seguito. Get-FSxDedupStatus
Per ulteriori informazioni sulla deduplicazione dei dati, consulta la documentazione di Microsoft Understanding Data Deduplication
Nota
Consulta le nostre best practice per. Utilizzo della deduplicazione dei dati Se riscontri problemi nel far funzionare correttamente i processi di deduplicazione dei dati, consulta. Risoluzione dei problemi di deduplicazione dei dati
avvertimento
Non è consigliabile eseguire determinati comandi Robocopy con deduplicazione dei dati perché questi comandi possono influire sull'integrità dei dati del Chunk Store. Per ulteriori informazioni, consulta la documentazione sull'interoperabilità di Microsoft Data Deduplication
Abilitazione della deduplicazione dei dati
È possibile abilitare la deduplicazione dei dati su una condivisione di file Amazon FSx for Windows File Server utilizzando Enable-FSxDedup
il comando seguente.
PS C:\Users\Admin>
Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock {Enable-FsxDedup }
Quando abiliti la deduplicazione dei dati, vengono create una pianificazione e una configurazione predefinite. È possibile creare, modificare e rimuovere pianificazioni e configurazioni utilizzando i comandi seguenti.
È possibile utilizzare il Disable-FSxDedup
comando per disabilitare completamente la deduplicazione dei dati sul file system.
Creazione di una pianificazione per la deduplicazione dei dati
Anche se la pianificazione predefinita funziona bene nella maggior parte dei casi, è possibile creare una nuova pianificazione di deduplicazione utilizzando il New-FsxDedupSchedule
comando, illustrato di seguito. Le pianificazioni di deduplicazione dei dati utilizzano l'ora UTC.
PS C:\Users\Admin>
Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock { New-FSxDedupSchedule -Name "CustomOptimization" -Type Optimization -Days Mon,Wed,Sat -Start 08:00 -DurationHours 7 }
Questo comando crea una pianificazione denominata CustomOptimization
che viene eseguita nei giorni di lunedì, mercoledì e sabato, con inizio del processo alle 8:00 (UTC) di ogni giorno, con una durata massima di 7 ore, dopodiché il processo si interrompe se è ancora in esecuzione.
Si noti che la creazione di nuove pianificazioni dei processi di deduplicazione personalizzate non sostituisce né rimuove la pianificazione predefinita esistente. Prima di creare un processo di deduplicazione personalizzato, è possibile disabilitare il processo predefinito se non è necessario.
È possibile disabilitare la pianificazione di deduplicazione predefinita utilizzando il Set-FsxDedupSchedule
comando, illustrato di seguito.
PS C:\Users\Admin>
Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock {Set-FSxDedupSchedule -Name “BackgroundOptimization” -Enabled $false}
È possibile rimuovere una pianificazione di deduplicazione utilizzando il comando. Remove-FSxDedupSchedule -Name "ScheduleName"
Si noti che la pianificazione di BackgroundOptimization
deduplicazione predefinita non può essere modificata o rimossa e dovrà invece essere disabilitata.
Modifica di una pianificazione di deduplicazione dei dati
È possibile modificare una pianificazione di deduplicazione esistente utilizzando il Set-FsxDedupSchedule
comando, illustrato di seguito.
PS C:\Users\Admin>
Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FSxRemoteAdmin -ScriptBlock { Set-FSxDedupSchedule -Name "CustomOptimization" -Type Optimization -Days Mon,Tues,Wed,Sat -Start 09:00 -DurationHours 9 }
Questo comando modifica la CustomOptimization
pianificazione esistente in modo che venga eseguita nei giorni dal lunedì al mercoledì e al sabato, avviando il processo alle 9:00 (UTC) di ogni giorno, con una durata massima di 9 ore, dopodiché il processo si interrompe se è ancora in esecuzione.
Per modificare l'età minima del file prima di ottimizzare l'impostazione, utilizzare il comando. Set-FSxDedupConfiguration
Visualizzazione della quantità di spazio risparmiato
Per visualizzare la quantità di spazio su disco risparmiata dall'esecuzione della deduplicazione dei dati, utilizzare il Get-FSxDedupStatus
comando, come segue.
PS C:\Users\Admin>
Invoke-Command -ComputerName amznfsxzzzzzzzz.corp.example.com -ConfigurationName FsxRemoteAdmin -ScriptBlock { Get-FSxDedupStatus } | select OptimizedFilesCount,OptimizedFilesSize,SavedSpace,OptimizedFilesSavingsRate
OptimizedFilesCount OptimizedFilesSize SavedSpace OptimizedFilesSavingsRate ------------------- ------------------ ---------- ------------------------- 12587 31163594 25944826 83
Nota
I valori mostrati nella risposta al comando per i seguenti parametri non sono affidabili e non è necessario utilizzare questi valori: Capacity,, FreeSpace UsedSpace UnoptimizedSize, e. SavingsRate
Gestione della deduplicazione dei dati
Puoi gestire la deduplicazione dei dati sul tuo file system utilizzando l'interfaccia a riga di comando di Amazon FSx per la gestione remota su. PowerShell Per informazioni su come utilizzare questa CLI, consulta. Guida introduttiva a riga di comando di Amazon FSx per la gestione remota su PowerShell
Di seguito sono riportati i comandi che è possibile utilizzare per la deduplicazione dei dati.
Comando di deduplicazione dei dati | Descrizione |
---|---|
Enable-FSxDedup |
Abilita la deduplicazione dei dati nella condivisione di file. La compressione dei dati dopo la deduplicazione è abilitata per impostazione predefinita quando si abilita la deduplicazione dei dati. |
Disable-FSxDedup |
Disattiva la deduplicazione dei dati nella condivisione di file. |
Get-FSxDedupConfiguration |
Recupera le informazioni sulla configurazione della deduplicazione, tra cui la dimensione e la data minime del file per l'ottimizzazione, le impostazioni di compressione e i tipi di file e le cartelle esclusi. |
Set-FSxDedupConfiguration |
Modifica le impostazioni di configurazione della deduplicazione, tra cui dimensione e età minime dei file per l'ottimizzazione, le impostazioni di compressione e i tipi di file e le cartelle esclusi. |
Get-FSxDedupStatus |
Recupera lo stato della deduplicazione e include proprietà di sola lettura che descrivono i risparmi e lo stato dell'ottimizzazione sul file system, i tempi e lo stato di completamento degli ultimi lavori sul file system. |
Get-FSxDedupMetadata |
Recupera i metadati di ottimizzazione della deduplicazione. |
Update-FSxDedupStatus |
Calcola e recupera informazioni aggiornate per risparmiare sulla deduplicazione dei dati. |
Measure-FSxDedupFileMetadata |
Misura e recupera lo spazio di archiviazione potenziale che è possibile recuperare sul file system se si elimina un gruppo di cartelle. Spesso i file hanno blocchi condivisi tra altre cartelle e il motore di deduplicazione calcola quali blocchi sono unici e quali verrebbero eliminati. |
Get-FSxDedupSchedule |
Recupera le pianificazioni di deduplicazione attualmente definite. |
New-FSxDedupSchedule |
Crea e personalizza una pianificazione di deduplicazione dei dati. |
Set-FSxDedupSchedule |
Modifica le impostazioni di configurazione per i piani di deduplicazione dei dati esistenti. |
Remove-FSxDedupSchedule |
Elimina una pianificazione di deduplicazione. |
Get-FSxDedupJob |
Ottiene lo stato e le informazioni per tutti i processi di deduplicazione attualmente in esecuzione o in coda. |
Stop-FSxDedupJob |
Annulla uno o più processi di deduplicazione dei dati specificati. |
La guida in linea di ogni comando fornisce un riferimento a tutte le opzioni di comando. Per accedere a questa guida, esegui il comando con-?, ad esempioEnable-FSxDedup -?.