Modalità di velocità di trasmissione effettiva - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Modalità di velocità di trasmissione effettiva

Amazon SageMaker Feature Store offre due modelli di prezzo tra cui scegliere: modalità di throughput on-demand (On-demand) e provisioned (Provisioned). On-demandfunziona meglio per un traffico meno prevedibile, mentre Provisioned funziona meglio per un traffico coerente e prevedibile.

È possibile passare On-demand da una modalità di Provisioned throughput all'altra per un determinato gruppo di funzionalità, per adattarsi ai periodi in cui i modelli di traffico delle applicazioni cambiano o sono meno prevedibili. È possibile aggiornare la modalità di throughput del gruppo di funzionalità solo a On-demand una volta ogni 24 ore. La modalità throughput può essere aggiornata a livello di codice utilizzando UpdateFeatureGroupAPIo tramite l'interfaccia utente della console. Per ulteriori informazioni sull'utilizzo della console, consulta. Utilizzo di Amazon SageMaker Feature Store nella console

È possibile utilizzare la modalità Provisioned throughput con gruppi di funzionalità solo offline o gruppi di funzionalità con il tipo di archiviazione. Standard Per altre configurazioni di archiviazione, viene utilizzata la On-demand modalità throughput. Per informazioni sulle configurazioni di archiviazione online e offline, vedere Archivio online eArchivio offline, rispettivamente.

Per maggiori dettagli sui prezzi, consulta la pagina SageMaker dei prezzi di Amazon.

Modalità di throughput su richiesta

La modalità di trasmissione On-demand (predefinita) funziona meglio quando si utilizzano gruppi di funzionalità con carico di lavoro sconosciuto, traffico di applicazioni imprevedibile e non è possibile prevedere i requisiti di capacità.

La On-demand modalità vi addebita per le letture e le scritture eseguite dall'applicazione sui vostri gruppi di funzionalità. Non è necessario specificare la velocità di lettura e scrittura prevista dall'applicazione, perché Feature Store si adatta istantaneamente ai carichi di lavoro man mano che aumentano o diminuiscono. Paghi solo per ciò che usi, misurato in e. ReadRequestsUnits WriteRequestsUnits

È possibile abilitare la modalità On-demand throughput utilizzando CreateFeatureGroupUpdateFeatureGroupAPIso tramite l'interfaccia utente della console. Per ulteriori informazioni sull'utilizzo dell'interfaccia utente della console, consultaUtilizzo di Amazon SageMaker Feature Store nella console.

Importante

È possibile aggiornare la modalità di trasmissione del gruppo di funzionalità solo a On-demand una volta ogni 24 ore.

Modalità di throughput fornita

La modalità di Provisioned throughput funziona al meglio quando si utilizzano gruppi di funzionalità con carichi di lavoro prevedibili ed è possibile prevedere i requisiti di capacità per controllare i costi. Ciò può renderla più conveniente per determinati carichi di lavoro in cui è possibile anticipare in anticipo i requisiti di throughput.

Quando si imposta un gruppo di funzionalità sulla Provisioned modalità, si specificano le unità di capacità che rappresentano la quantità massima di capacità che un'applicazione può consumare da un gruppo di funzionalità. Se l'applicazione supera questa capacità di Provisioned throughput, è soggetta a limitazioni delle richieste.

Di seguito sono incluse informazioni sulle unità di capacità di lettura e scrittura.

  • Il recupero di un singolo record fino a 4 KB utilizzando il GetRecord API consumerà almeno 1 RCU (unità di capacità di lettura). Il recupero di payload più grandi potrebbe richiedere più tempo. Il numero totale di unità con capacità di lettura richieste dipende dalla dimensione dell'articolo, inclusi piccoli metadati per record aggiunti dal servizio Feature Store.

  • Una singola richiesta di scrittura con un payload di 1 KB che utilizza il PutRecord API consumerà almeno 1 WCU (unità di capacità di scrittura), con payload frazionari arrotondati al KB più vicino. Potrebbe consumare di più a seconda dell'ora dell'evento, dello stato di eliminazione del record e dello stato time to live ()TTL. Per ulteriori informazioni suTTL, vedereDurata Time to live (TTL) per i record.

Importante

Quando impostate le unità di capacità, tenete presente quanto segue:

  • Ti verranno addebitate le capacità di lettura e scrittura fornite per il tuo gruppo di funzionalità, anche se non utilizzi appieno la Provisioned capacità.

  • Se impostate una capacità di lettura o scrittura troppo bassa, le vostre richieste potrebbero subire delle limitazioni.

  • In alcuni casi, i record possono consumare un'unità di capacità aggiuntiva a causa dei metadati a livello di record aggiunti dal servizio Feature Store per abilitare varie funzionalità.

  • Il recupero solo di un sottoinsieme di funzionalità utilizza GetRecord o BatchGetRecord APIs consumerà comunque la quantità RCU corrispondente all'intero record.

  • Per quanto riguarda la capacità di scrittura, è necessario fornire il doppio della capacità di picco recente per evitare rallentamenti quando si eseguono backfill o ingestioni di massa, che possono comportare un gran numero di scritture di record storici. Questo perché la scrittura di record storici consuma una capacità di scrittura aggiuntiva.

  • Feature Store attualmente non supporta la scalabilità automatica per la Provisioned modalità.

È possibile abilitare la modalità On-demand throughput utilizzando CreateFeatureGroupUpdateFeatureGroupAPIso tramite l'interfaccia utente della console. Per ulteriori informazioni sull'utilizzo dell'interfaccia utente della console, consultaUtilizzo di Amazon SageMaker Feature Store nella console.

Di seguito viene descritto come aumentare o diminuire il WCU throughput RCU e per i gruppi di funzionalità quando la Provisioned modalità è abilitata.

Aumento della velocità effettiva assegnata

È possibile aumentare RCU o WCU con la frequenza necessaria utilizzando l'interfaccia utente UpdateFeatureGroupAPIo l'interfaccia utente della console.

Riduzione della velocità effettiva assegnata

È possibile diminuire RCU WCU (o entrambi) per i gruppi di funzionalità utilizzando l'interfaccia utente della UpdateFeatureGroupAPIconsole.

Esiste una quota predefinita in base al numero di riduzioni di Provisioned capacità che è possibile eseguire ogni giorno sul proprio gruppo di funzionalità. Un giorno è definito in base a Universal Time Coordinated (UTC). In un dato giorno, è possibile iniziare eseguendo fino a quattro diminuzioni in un'ora, purché non si siano ancora state eseguite altre diminuzioni nel corso dello stesso giorno. Successivamente, è possibile eseguire un'ulteriore riduzione all'ora purché non vi siano state riduzioni nell'ora precedente. Questo porta il numero massimo di riduzioni in un giorno a 27 (quattro riduzioni nella prima ora e una riduzione per ognuna delle successive finestre di un'ora in un giorno).

Metriche della modalità Throughput

Un gruppo di funzionalità in On-demand modalità emetterà e metriche. ConsumedReadRequestsUnits ConsumedWriteRequestsUnits Un gruppo di funzionalità in Provisioned modalità emetterà delle metriche. ConsumedReadCapacityUnits ConsumedWriteCapacityUnits Per ulteriori informazioni sulle metriche del Feature Store, consulta. Metriche SageMaker di Amazon Feature Store

Limiti della modalità Throughput

Ciascuno Account AWS ha quote o limiti di servizio predefiniti che vengono applicati per garantire la disponibilità e gestire i rischi di fatturazione. Per informazioni sulle quote e i limiti predefiniti, vedere. Quote, regole di denominazione e tipi di dati

In alcuni casi, questi limiti possono essere inferiori a quanto indicato nella documentazione. Se hai bisogno di limiti più elevati, puoi inviare una richiesta di aumento. È una buona idea farlo prima di raggiungere i limiti attuali per evitare interruzioni del lavoro. Per ulteriori informazioni sulle quote di servizio e su come richiedere un aumento delle quote, consulta Quote di servizio AWS.