Utilizzo di Amazon SageMaker Feature Store nella console - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo di Amazon SageMaker Feature Store nella console

Importante

IAMLe politiche personalizzate che consentono ad Amazon SageMaker Studio o Amazon SageMaker Studio Classic di creare SageMaker risorse Amazon devono inoltre concedere le autorizzazioni per aggiungere tag a tali risorse. L'autorizzazione per aggiungere tag alle risorse è necessaria perché Studio e Studio Classic taggano automaticamente tutte le risorse che creano. Se una IAM politica consente a Studio e Studio Classic di creare risorse ma non consente l'aggiunta di tag, si possono verificare errori AccessDenied "" durante il tentativo di creare risorse. Per ulteriori informazioni, consulta Fornisci le autorizzazioni per etichettare le risorse SageMaker.

AWS Policy gestite per Amazon SageMakerche concedono le autorizzazioni per creare SageMaker risorse includono già le autorizzazioni per aggiungere tag durante la creazione di tali risorse.

Puoi utilizzare Amazon SageMaker Feature Store sulla console per creare, visualizzare, aggiornare e monitorare i tuoi gruppi di funzionalità. Il monitoraggio in questa guida include la visualizzazione delle esecuzioni della pipeline e della derivazione dei gruppi di funzionalità. Questa guida fornisce istruzioni su come eseguire queste attività dalla console.

Per esempi e risorse sul Feature Store che utilizzano Amazon SageMaker APIs e AWS SDK for Python (Boto3), consultaRisorse SageMaker di Amazon Feature Store.

Crea un gruppo di funzionalità dalla console

Il processo di creazione del gruppo di funzionalità prevede quattro fasi:

  1. Inserisci le informazioni sul gruppo di funzionalità.

  2. Inserisci le definizioni delle funzionalità.

  3. Inserisci le funzionalità richieste.

  4. Inserisci i tag del gruppo di funzionalità.

Considerate quale delle seguenti opzioni è adatta al vostro caso d'uso:

  • Crea un archivio online, un archivio offline o entrambi. Per ulteriori informazioni sulle differenze tra negozi online e offline, consultaConcetti di base sul Feature Store.

  • Usa una AWS Key Management Service chiave predefinita o una tua KMS chiave. La chiave predefinita è AWS KMS key (SSE-KMS). Puoi ridurre i costi delle AWS KMS richieste configurando l'uso di Amazon S3 Bucket Keys nel bucket Amazon S3 dello store offline. La chiave Amazon S3 Bucket deve essere abilitata prima di utilizzarla per i tuoi gruppi di funzionalità. Per ulteriori informazioni sulla riduzione dei costi utilizzando Amazon S3 Bucket Keys, consulta Riduzione del costo di SSE - with Amazon KMS S3 Bucket Keys.

    Puoi utilizzare la stessa chiave per gli archivi online e offline o configurare una chiave univoca per ciascuno di essi. Per ulteriori informazioni su, consulta. AWS KMSAWS Key Management Service

  • Se crei un archivio offline:

    • Decidi se creare un bucket Amazon S3 o utilizzarne uno esistente. Quando ne usi uno esistente, devi conoscere il nome del bucket Amazon S3 o del bucket Amazon URL S3 e il nome della directory del set di dati, se applicabile.

    • Scegli quale Amazon Resource Name (ARN) utilizzare per specificare il IAM ruolo. Per ulteriori informazioni su come trovare il tuo ruolo e le politiche associate, consultaAggiungere politiche al proprio IAM ruolo.

    • Decidi se utilizzare il formato AWS Glue (predefinito) o Apache Iceberg tabellare. Nella maggior parte dei casi d'uso, si utilizza il formato Apache Iceberg tabella. Per ulteriori informazioni sui formati delle tabelle, vedereUsa Feature Store con SDK per Python (Boto3).

È possibile utilizzare la console per visualizzare la discendenza di un gruppo di funzionalità. Le istruzioni per utilizzare Feature Store sulla console variano a seconda che l'esperienza sia abilitata Amazon SageMaker Studio o Amazon SageMaker Studio Classic predefinita.

  1. Apri la console Studio seguendo le istruzioni riportate inAvvia Amazon SageMaker Studio.

  2. Scegli Dati dal riquadro di navigazione a sinistra per espandere l'elenco a discesa.

  3. Dall'elenco a discesa, scegli Feature Store.

  4. Seleziona Crea gruppo di funzionalità.

  5. In Dettagli del gruppo di funzionalità, inserisci un nome per il gruppo di funzionalità.

  6. (Facoltativo) Immetti una descrizione per il gruppo di funzionalità.

  7. In Configurazione dell'archiviazione del gruppo di funzionalità, scegli una configurazione di archiviazione dall'elenco a discesa. Per informazioni sulle configurazioni di archiviazione, consulta. Configurazioni di archiviazione dell'archivio funzionalità

  8. Se hai scelto di abilitare l'archiviazione online:

    1. Se abiliti solo l'archiviazione online, puoi scegliere un tipo di archiviazione dall'elenco a discesa. Per informazioni sui tipi di archiviazione nei negozi online, consultaArchivio online.

    2. (Facoltativo) Applica Time to Live (TTL) posizionando l'interruttore su On e specificando il valore e l'unità di durata di Time to Live. Ciò aggiornerà la TTL durata predefinita per tutti i record aggiunti al gruppo di funzionalità dopo la creazione del gruppo di funzionalità. Per ulteriori informazioni suTTL, vedereDurata Time to live (TTL) per i record.

  9. Se hai scelto di abilitare l'archiviazione offline:

    1. Sotto il nome del bucket Amazon S3, inserisci un nuovo nome di bucket o inserisci manualmente un bucket esistente. URL

    2. Dall'elenco a discesa Formato tabella, scegli il formato di tabella. Nella maggior parte dei casi d'uso, è necessario utilizzare il formato tabellare. Apache Iceberg Per ulteriori informazioni sui formati delle tabelle, vedereUsa Feature Store con SDK per Python (Boto3).

    3. In IAMRuolo ARN, scegli il IAM ruolo ARN che desideri assegnare a questo gruppo di funzionalità. Per ulteriori informazioni su come trovare il ruolo e le politiche associate, consultaAggiungere politiche al proprio IAM ruolo.

    4. Se hai scelto di abilitare il formato tabella di archiviazione offline e il formato tabella AWS Glue (predefinito), in Catalogo dati puoi scegliere una delle due opzioni seguenti:

      • Usa i valori predefiniti per il tuo AWS Glue Data Catalog.

      • Fornisci il nome del catalogo dati esistente, il nome della tabella e il nome del database per estendere quelli esistenti AWS Glue Data Catalog.

  10. Nell'elenco a discesa Chiave di crittografia del negozio online o Chiave di crittografia del negozio offline, scegli una delle seguenti opzioni:

    • Usa AWS gestita AWS KMS key (impostazione predefinita)

    • Inserisci una AWS KMS chiave AWS KMS key ARN e inserisci la tua ARN in Chiave di crittografia del negozio offline ARN. Per ulteriori informazioni in merito AWS KMS, consulta AWS Key Management Service.

  11. Se applicabile, avrai la possibilità di scegliere la modalità di throughput, che influisce sulla modalità di addebito. In modalità Throughput, scegli una modalità dall'elenco a discesa e inserisci le capacità di lettura e scrittura, se disponibili. Per informazioni sulle modalità di trasmissione, ad esempio quando è possibile applicare la modalità e sulle unità di capacità, consulta. Modalità di velocità di trasmissione effettiva

  12. Dopo aver specificato tutte le informazioni richieste, il pulsante Continua appare disponibile. Scegli Continua.

  13. In Specificare le definizioni delle funzionalità, sono disponibili due opzioni per fornire uno schema per le funzionalità: un JSON editor o un editor di tabelle.

    • JSONeditor: nella JSONscheda, inserite o copiate e incollate le definizioni delle feature nel JSON formato.

    • Editor di tabelle: nella scheda Tabella, inserite il nome della feature e scegliete il tipo di dati corrispondente per ogni feature del gruppo di feature. Scegli + Aggiungi definizioni di funzionalità per includere altre funzionalità. Tieni presente che non puoi rimuovere le definizioni delle funzionalità dai tuoi gruppi di funzionalità. Tuttavia, potete aggiungere e aggiornare le definizioni delle feature dopo la creazione del gruppo di feature.

    In un gruppo di funzionalità devono essere presenti almeno due feature che rappresentino l'identificatore del record e l'ora dell'evento:

    • Il tipo di feature del record può essere una stringa, un frazionario o un integrale.

    • L'ora dell'evento Il tipo di feature deve essere una stringa o un elemento frazionario. Tuttavia, se avete scelto il formato della Iceberg tabella, l'ora dell'evento deve essere una stringa.

  14. Dopo aver incluso tutte le funzionalità, scegli Continua.

  15. In Seleziona le funzionalità richieste, devi specificare l'identificatore del record e le funzioni relative all'ora dell'evento. A tale scopo, scegli il nome della funzione negli elenchi a discesa Record identifier feature name e Event time Feature Name, rispettivamente.

  16. Dopo aver scelto le funzioni dell'identificatore del record e dell'ora dell'evento, scegli Continua.

  17. (Facoltativo) Per aggiungere tag per il gruppo di funzionalità, scegli Aggiungi nuovo tag. Quindi inserite una chiave di tag e il valore corrispondente rispettivamente in Chiave e Valore.

  18. Scegli Continua.

  19. In Rivedi gruppo di funzionalità, rivedi le informazioni sul gruppo di funzionalità. Per modificare qualsiasi passaggio, scegli il pulsante Modifica corrispondente a quel passaggio. Si passa quindi alla fase di modifica corrispondente. Per tornare alla fase 5, scegli Continua fino a tornare alla fase 5.

  20. Dopo aver finalizzato la configurazione per il tuo gruppo di funzionalità, scegli Crea gruppo di funzionalità.

    Se si verifica un problema durante la configurazione, nella parte inferiore della pagina viene visualizzato un messaggio di avviso pop-up con suggerimenti per la risoluzione del problema. Puoi tornare ai passaggi precedenti per risolvere i problemi scegliendo Modifica come passaggio relativo ai conflitti.

    Dopo che il gruppo di funzionalità è stato creato con successo, nella parte inferiore della pagina viene visualizzato un messaggio pop-up verde. Il nuovo gruppo di funzionalità appare anche nel catalogo dei gruppi di funzionalità.

Visualizza i dettagli del gruppo di funzionalità dalla console

Puoi visualizzare i dettagli dei tuoi gruppi di funzionalità dopo che un gruppo di funzionalità è stato creato con successo nel Feature Store.

Puoi utilizzare la console o Amazon SageMaker Feature Store API per visualizzare i dettagli del tuo gruppo di funzionalità. Le istruzioni per utilizzare Feature Store tramite la console dipendono dal fatto che tu l'abbia abilitata Amazon SageMaker Studio o Amazon SageMaker Studio Classic come esperienza predefinita.

  1. Apri la console Studio seguendo le istruzioni riportate inAvvia Amazon SageMaker Studio.

  2. Scegli Dati nel riquadro di navigazione a sinistra per espandere l'elenco a discesa.

  3. Dall'elenco a discesa, scegli Feature Store.

  4. (Facoltativo) Per visualizzare i tuoi gruppi di funzionalità, scegli Il mio account. Per visualizzare i gruppi di funzionalità condivisi, scegli Cross account.

  5. Nella scheda Catalogo del Feature Store, scegli il nome del tuo gruppo di funzionalità dall'elenco. Si apre la pagina del gruppo di funzionalità.

  6. Nella scheda Funzionalità, puoi trovare un elenco di tutte le funzionalità. Usa il filtro per perfezionare l'elenco. Scegli una funzionalità per visualizzarne i dettagli.

  7. Nella scheda Dettagli e nella sottoscheda Informazioni, puoi rivedere le informazioni sul tuo gruppo di funzionalità. Ciò include l'esecuzione più recente, le impostazioni di archiviazione offline, le impostazioni di archiviazione online e altro ancora.

  8. Nella scheda Dettagli e nella sottoscheda Tag, puoi esaminare i tag del tuo gruppo di funzionalità. Scegli Aggiungi nuovo tag per aggiungere un nuovo tag o Rimuovi per rimuovere un tag.

  9. Nella scheda Pipeline Executions, puoi visualizzare le pipeline associate o le esecuzioni di pipeline per il tuo gruppo di funzionalità.

  10. Nella scheda Lineage, puoi visualizzare la derivazione del tuo gruppo di funzionalità.

Aggiorna un gruppo di funzionalità dalla console

Puoi aggiornare i tuoi gruppi di funzionalità dopo che un gruppo di funzionalità è stato creato correttamente nel Feature Store.

Puoi utilizzare la console o Amazon SageMaker Feature Store API per aggiornare un gruppo di funzionalità. Le istruzioni per utilizzare Feature Store tramite la console dipendono dal fatto che tu l'abbia abilitata Amazon SageMaker Studio o Amazon SageMaker Studio Classic come esperienza predefinita.

  1. Apri la console Studio seguendo le istruzioni riportate inAvvia Amazon SageMaker Studio.

  2. Scegli Dati nel riquadro di navigazione a sinistra per espandere l'elenco a discesa.

  3. Dall'elenco a discesa, scegli Feature Store.

  4. (Facoltativo) Per visualizzare i tuoi gruppi di funzionalità, scegli Il mio account. Per visualizzare i gruppi di funzionalità condivisi, scegli Cross account.

  5. Nella scheda Catalogo del gruppo di funzionalità, cerca e scegli il nome del tuo gruppo di funzionalità dall'elenco. Si apre la pagina del gruppo di funzionalità.

  6. Seleziona Aggiorna gruppo di funzionalità.

  7. (Facoltativo) Se applicabile, puoi modificare la modalità di throughput, che influisce sulla modalità di addebito. In modalità Throughput, scegliete una modalità dall'elenco a discesa e inserite le capacità di lettura e scrittura, se disponibili. Per informazioni sulle modalità di trasmissione, ad esempio quando è possibile applicare la modalità e sulle unità di capacità, consulta. Modalità di velocità di trasmissione effettiva

  8. (Facoltativo) Se il tuo gruppo di funzionalità utilizza il negozio online, puoi aggiornare il Time to Live predefinito (TTL). Se TTL non è stato abilitato per il gruppo di funzionalità, attiva il pulsante di commutazione sotto Time to Live (TTL). Puoi specificare il TTL valore e l'unità in Durata Time to Live. Ciò aggiornerà la TTL durata predefinita per tutti i record aggiunti al gruppo di funzionalità dopo l'aggiornamento del gruppo di funzionalità.

  9. (Facoltativo) È possibile aggiungere definizioni di funzionalità al proprio gruppo di funzionalità, ma non è possibile rimuovere le definizioni di funzionalità dai gruppi di funzionalità. Per aggiungere una definizione di feature, scegliete + Aggiungi definizione di feature, quindi specificate il nome della nuova definizione di feature nella colonna Nome e selezionate il tipo di feature nella colonna Feature type.

  10. Scegli Save changes (Salva modifiche).

  11. Per confermare le modifiche, scegliete Conferma.

Visualizza le esecuzioni della pipeline dalla console

È possibile visualizzare le informazioni più recenti sull'esecuzione della pipeline per una funzionalità o un gruppo di funzionalità in Pipeline executions. È inoltre possibile ottenere collegamenti a pipeline, esecuzioni, codice e altre informazioni utili sull'esecuzione.

Puoi usare la console per visualizzare le esecuzioni della pipeline. Le istruzioni per utilizzare Feature Store tramite la console dipendono dal fatto che l'esperienza sia stata abilitata Amazon SageMaker Studio o Amazon SageMaker Studio Classic predefinita.

  1. Apri la console Studio seguendo le istruzioni riportate in. Avvia Amazon SageMaker Studio

  2. Scegli Dati nel riquadro di navigazione a sinistra per espandere l'elenco a discesa.

  3. Dall'elenco a discesa, scegli Feature Store.

  4. (Facoltativo) Per visualizzare i tuoi gruppi di funzionalità, scegli Il mio account. Per visualizzare i gruppi di funzionalità condivisi, scegli Cross account.

  5. Scegli un gruppo di funzionalità o una funzionalità per visualizzare le loro esecuzioni nella pipeline.

  6. Scegli la scheda Esecuzioni pipeline.

  7. Cerca una pipeline dall'elenco a discesa Seleziona pipeline.

  8. È possibile visualizzare i collegamenti per la pipeline, l'esecuzione e i dettagli del codice. È inoltre possibile visualizzare il proprietario, lo stato, la data e la durata dell'esecuzione.

Visualizza la discendenza dalla console

È possibile visualizzare la discendenza di un gruppo di funzionalità. La discendenza include le informazioni sul codice di esecuzione del flusso di lavoro di elaborazione delle funzionalità, sulle fonti di dati utilizzate e sul modo in cui vengono inserite nel gruppo di funzionalità o nella funzionalità.

È possibile utilizzare la console per visualizzare la discendenza di un gruppo di funzionalità. Le istruzioni sull'utilizzo del Feature Store tramite la console dipendono dal fatto che l'esperienza sia abilitata Amazon SageMaker Studio o Amazon SageMaker Studio Classic predefinita.

  1. Apri la console Studio seguendo le istruzioni riportate inAvvia Amazon SageMaker Studio.

  2. Scegli Dati dal riquadro di navigazione a sinistra per espandere l'elenco a discesa.

  3. Dall'elenco a discesa, scegli Feature Store.

  4. (Facoltativo) Per visualizzare i tuoi gruppi di funzionalità, scegli Il mio account. Per visualizzare i gruppi di funzionalità condivisi, scegli Cross account.

  5. Scegli un gruppo di funzionalità o una funzionalità per visualizzarne i dettagli sulla derivazione.

  6. Scegli la scheda Discendenza.

  7. Scegli un gruppo di funzionalità o un nodo di pipeline per espandere il nodo. Il nodo contiene ulteriori informazioni su un gruppo di funzionalità o una pipeline.

  8. È possibile ingrandire, rimpicciolire o ricentrare il grafico di discendenza utilizzando i pulsanti in basso a sinistra dello schermo.

  9. È possibile spostarsi all'interno della mappa di derivazione selezionando e trascinando lo schermo. Per spostare le mappe di derivazione usando i nodi come punto focale, puoi premere Tab o Shift+Tab per passare da un nodo all'altro.

  10. Se applicabile, puoi navigare nel lignaggio a monte (a sinistra, precedente) o a valle (a destra, più recente). A tale scopo, scegli un nodo e quindi scegli Query upstream lineage o Query downstream lineage.