Guardrail di implementazione per l'aggiornamento dei modelli in produzione - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Guardrail di implementazione per l'aggiornamento dei modelli in produzione

I guardrail di implementazione sono un insieme di opzioni di implementazione dei modelli in Amazon SageMaker AI Inference per aggiornare i modelli di machine learning in produzione. Utilizzando le opzioni di implementazione completamente gestite, è possibile controllare il passaggio dal modello corrente in produzione a uno nuovo. Le modalità di spostamento del traffico nelle implementazioni blu/verde, come canary e lineare, offrono un controllo granulare sul processo di spostamento del traffico dal modello attuale a quello nuovo nel corso dell'aggiornamento. Sono inoltre disponibili misure di protezione integrate, come i rollback automatici, che aiutano a individuare tempestivamente i problemi e ad adottare automaticamente azioni correttive prima che abbiano un impatto significativo sulla produzione.

I guardrail di implementazione offrono i seguenti vantaggi:

  • Sicurezza dell'implementazione durante l'aggiornamento degli ambienti di produzione. Un aggiornamento regressivo a un ambiente di produzione può causare tempi di inattività non pianificati e un impatto aziendale, come una maggiore latenza del modello e tassi di errore elevati. I guardrail di implementazione aiutano a mitigare tali rischi fornendo le migliori pratiche e barriere di sicurezza operative integrate.

  • Implementazione completamente gestita. SageMaker L'intelligenza artificiale si occupa della configurazione e dell'orchestrazione di queste implementazioni e le integra con i meccanismi di aggiornamento degli endpoint. Non è necessario creare e mantenere meccanismi di orchestrazione, monitoraggio o rollback. Puoi sfruttare l' SageMaker intelligenza artificiale per configurare e orchestrare queste implementazioni e concentrarti sullo sfruttamento del machine learning per le tue applicazioni.

  • Visibilità. Puoi monitorare l'avanzamento della tua distribuzione tramite l'DescribeEndpointAPI o tramite Amazon CloudWatch Events (per gli endpoint supportati). Per ulteriori informazioni sugli eventi nell' SageMaker intelligenza artificiale, consulta la sezione Modifica dello stato di distribuzione degli endpoint in. Eventi che Amazon SageMaker AI invia ad Amazon EventBridge Tieni presente che se il tuo endpoint utilizza una delle funzionalità della Esclusioni pagina, non puoi utilizzare CloudWatch Events.

Nota

I guardrail di implementazione si applicano solo ai tipi di endpoint Inferenza asincrona e Inferenza in tempo reale.

Come iniziare

Supportiamo due tipi di implementazioni per aggiornare i modelli in produzione: implementazioni blu/verdi e implementazioni continue.

  • Distribuzioni blu/verdi: puoi spostare il traffico dal tuo vecchio parco istanze (il parco istanze blu) a un nuovo parco istanze (parco istanze verde) con gli aggiornamenti. Le implementazioni blu/verde offrono diverse modalità di spostamento del traffico. Una modalità di spostamento del traffico è una configurazione che specifica in che modo l' SageMaker IA indirizza il traffico degli endpoint verso una nuova flotta contenente gli aggiornamenti. Le seguenti modalità di spostamento del traffico offrono diversi livelli di controllo sul processo di aggiornamento degli endpoint:

    • Usa lo spostamento del traffico tutto in una volta sposta tutto il traffico degli endpoint dal parco istanze blu a quello verde. Una volta che il traffico si sposta verso la flotta verde, i tuoi CloudWatch allarmi Amazon preimpostati iniziano a monitorare la flotta verde per un determinato periodo di tempo (il periodo di cottura). Se durante il periodo di cottura non scatta alcun allarme, l' SageMaker IA interrompe la flotta blu.

    • Usa lo spostamento del traffico delle Canarie sposta una piccola parte del traffico (un canary) verso il parco istanze verde e la monitora per un periodo di baking. Se il canarino vince con la flotta verde, l' SageMaker IA sposta il resto del traffico dalla flotta blu a quella verde prima di porre fine alla flotta blu.

    • Usa lo spostamento lineare del traffico offre una personalizzazione ancora maggiore rispetto al numero di fasi di spostamento del traffico e alla percentuale di traffico da spostare per ciascuna fase. Mentre lo spostamento canary consente di spostare il traffico in due fasi, lo spostamento lineare lo estende a n fasi distanziate in modo lineare.

  • Usa distribuzioni continue: Puoi aggiornare il tuo endpoint man mano che l' SageMaker IA rifornisce la capacità in modo incrementale e sposta il traffico verso una nuova flotta in fasi di dimensioni di batch da te specificate. Le istanze del nuovo parco istanze vengono aggiornate con la nuova configurazione di implementazione e, se durante il periodo di cottura non si CloudWatch verifica alcun allarme, l' SageMaker intelligenza artificiale ripulisce le istanze del vecchio parco istanze. Questa opzione offre un controllo granulare sul numero di istanze o sulla percentuale di capacità spostata durante ogni fase.

Puoi creare e gestire la tua implementazione tramite l'API UpdateEndpointe CreateEndpoint SageMaker i comandi. AWS Command Line Interface Consulta le pagine di distribuzione individuali per maggiori dettagli su come configurare la distribuzione. Tieni presente che se l'endpoint utilizza una delle funzionalità elencate nella pagina Esclusioni, non puoi utilizzare i guardrail di distribuzione.

Per seguire esempi guidati che mostrano come utilizzare i guardrail di implementazione, guarda i nostri esempi di notebook Jupyter per le modalità di spostamento del traffico canary e lineare.