Seleziona le tue preferenze relative ai cookie

Utilizziamo cookie essenziali e strumenti simili necessari per fornire il nostro sito e i nostri servizi. Utilizziamo i cookie prestazionali per raccogliere statistiche anonime in modo da poter capire come i clienti utilizzano il nostro sito e apportare miglioramenti. I cookie essenziali non possono essere disattivati, ma puoi fare clic su \"Personalizza\" o \"Rifiuta\" per rifiutare i cookie prestazionali.

Se sei d'accordo, AWS e le terze parti approvate utilizzeranno i cookie anche per fornire utili funzionalità del sito, ricordare le tue preferenze e visualizzare contenuti pertinenti, inclusa la pubblicità pertinente. Per continuare senza accettare questi cookie, fai clic su \"Continua\" o \"Rifiuta\". Per effettuare scelte più dettagliate o saperne di più, fai clic su \"Personalizza\".

Addestra riconoscitori personalizzati (console)

Modalità Focus
Addestra riconoscitori personalizzati (console) - Amazon Comprehend

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Puoi creare riconoscitori di entità personalizzati utilizzando la console Amazon Comprehend. Questa sezione mostra come creare e addestrare un riconoscitore di entità personalizzato.

Argomenti

    Per creare il riconoscimento di entità personalizzato, fornisci innanzitutto un set di dati per addestrare il tuo modello. Con questo set di dati, includi uno dei seguenti: un set di documenti annotati o un elenco di entità e la relativa etichetta di tipo, insieme a un set di documenti contenenti tali entità. Per ulteriori informazioni, consulta Riconoscimento personalizzato delle entità

    Per addestrare un riconoscitore di entità personalizzato con un file CSV
    1. Accedi AWS Management Console e apri la console Amazon Comprehend all'indirizzo https://console.aws.amazon.com/comprehend/

    2. Dal menu a sinistra, scegli Personalizzazione, quindi scegli Riconoscimento personalizzato delle entità.

    3. Scegli Crea nuovo modello.

    4. Assegna un nome al riconoscitore. Il nome deve essere univoco all'interno della regione e dell'account.

    5. Seleziona la lingua.

    6. In Tipo di entità personalizzato, inserisci un'etichetta personalizzata che desideri che il riconoscitore trovi nel set di dati.

      Il tipo di entità deve essere in lettere maiuscole e, se è composto da più di una parola, separale con un carattere di sottolineatura.

    7. Scegli Aggiungi tipo.

    8. Se desideri aggiungere un altro tipo di entità, inseriscilo e quindi scegli Aggiungi tipo. Se desideri rimuovere uno dei tipi di entità che hai aggiunto, scegli Rimuovi tipo, quindi scegli il tipo di entità da rimuovere dall'elenco. È possibile elencare un massimo di 25 tipi di entità.

    9. Per crittografare il tuo lavoro di formazione, scegli la crittografia Recognizer, quindi scegli se utilizzare una KMS chiave associata all'account corrente o una di un altro account.

      • Se utilizzi una chiave associata all'account corrente, per ID KMS chiave scegli l'ID della chiave.

      • Se utilizzi una chiave associata a un account diverso, come KMSchiave ARN inserisci ARN l'ID della chiave.

      Nota

      Per ulteriori informazioni sulla creazione e l'utilizzo KMS delle chiavi e sulla crittografia associata, vedere AWS Key Management Service.

    10. In Specifiche dei dati, scegli il formato dei tuoi documenti di formazione:

      • CSVfile: un CSV file che integra i documenti di formazione. Il CSV file contiene informazioni sulle entità personalizzate che il modello addestrato rileverà. Il formato richiesto del file dipende dal fatto che stiate fornendo annotazioni o un elenco di entità.

      • Augmented manifest: set di dati etichettato prodotto da Amazon Ground Truth SageMaker . Questo file è in JSON formato righe. Ogni riga è un JSON oggetto completo che contiene un documento di formazione e le relative etichette. Ogni etichetta annota un'entità denominata nel documento di formazione. È possibile fornire fino a 5 file manifest aumentati.

      Per ulteriori informazioni sui formati disponibili e per esempi, vedereAddestramento di modelli di riconoscimento di entità personalizzati.

    11. In Tipo di allenamento, scegli il tipo di allenamento da utilizzare:

      • Utilizzo di annotazioni e documenti di formazione

      • Utilizzo dell'elenco delle entità e dei documenti di formazione

      Se scegli le annotazioni, inserisci il file URL delle annotazioni in Amazon S3. Puoi anche accedere al bucket o alla cartella in Amazon S3 in cui si trovano i file di annotazione e scegliere Browse S3.

      Se scegli un elenco di entità, inserisci l'elenco URL delle entità in Amazon S3. Puoi anche accedere al bucket o alla cartella in Amazon S3 in cui si trova l'elenco delle entità e scegliere Browse S3.

    12. Inserisci un set URL di dati di input contenente i documenti di formazione in Amazon S3. Puoi anche accedere al bucket o alla cartella in Amazon S3 in cui si trovano i documenti di formazione e scegliere Seleziona cartella.

    13. In Set di dati di test seleziona come desideri valutare le prestazioni del tuo modello addestrato: puoi farlo sia per le annotazioni che per i tipi di addestramento con elenco di entità.

      • Autosplit: Autosplit seleziona automaticamente il 10% dei dati di formazione forniti da utilizzare come dati di test

      • (Facoltativo) Forniti dal cliente: quando si seleziona Fornito dal cliente, è possibile specificare esattamente quali dati di test si desidera utilizzare.

    14. Se selezioni Set di dati di test fornito dal cliente, inserisci il file URL delle annotazioni in Amazon S3. Puoi anche accedere al bucket o alla cartella in Amazon S3 in cui si trovano i file di annotazione e scegliere Seleziona cartella.

    15. Nella sezione Scegli un IAM ruolo, seleziona un IAM ruolo esistente o creane uno nuovo.

      • Scegli un IAM ruolo esistente: seleziona questa opzione se disponi già di un IAM ruolo con le autorizzazioni per accedere ai bucket di input e output di Amazon S3.

      • Crea un nuovo IAM ruolo: seleziona questa opzione se desideri creare un nuovo IAM ruolo con le autorizzazioni appropriate per Amazon Comprehend per accedere ai bucket di input e output.

        Nota

        Se i documenti di input sono crittografati, il IAM ruolo utilizzato deve disporre dell'autorizzazione. kms:Decrypt Per ulteriori informazioni, consulta Autorizzazioni necessarie per utilizzare la crittografia KMS.

    16. (Facoltativo) Per avviare le tue risorse in Amazon Comprehend da unVPC, inserisci l'VPCID sotto VPCo scegli l'ID dall'elenco a discesa.

      1. Scegli la sottorete in Subnet (s). Dopo aver selezionato la prima sottorete, è possibile sceglierne altre.

      2. In Gruppi di sicurezza, scegli il gruppo di sicurezza da utilizzare, se ne hai specificato uno. Dopo aver selezionato il primo gruppo di sicurezza, puoi sceglierne altri.

      Nota

      Quando si utilizza un processo VPC di riconoscimento delle entità personalizzato, l'operazione DataAccessRole utilizzata per le operazioni di creazione e avvio deve disporre delle autorizzazioni necessarie per VPC accedere ai documenti di input e al bucket di output.

    17. (Facoltativo) Per aggiungere un tag al riconoscimento di entità personalizzato, inserisci una coppia chiave-valore in Tag. Selezionare Aggiungi tag. Per rimuovere questa coppia prima di creare il riconoscitore, scegliete Rimuovi tag.

    18. Scegliete Treno.

    Il nuovo sistema di riconoscimento verrà quindi visualizzato nell'elenco, mostrandone lo stato. Verrà inizialmente visualizzato comeSubmitted. Verrà quindi visualizzato Training per un classificatore che sta elaborando documenti di formazione, Trained per un classificatore pronto all'uso e In error per un classificatore che presenta un errore. È possibile fare clic su un lavoro per ottenere ulteriori informazioni sul programma di riconoscimento, inclusi eventuali messaggi di errore.

    Creazione di un riconoscitore di entità personalizzato utilizzando il formato console CSV

    Per creare il riconoscimento di entità personalizzato, fornisci innanzitutto un set di dati per addestrare il tuo modello. Con questo set di dati, includi uno dei seguenti: un set di documenti annotati o un elenco di entità e la relativa etichetta di tipo, insieme a un set di documenti contenenti tali entità. Per ulteriori informazioni, consulta Riconoscimento personalizzato delle entità

    Per addestrare un riconoscitore di entità personalizzato con un file CSV
    1. Accedi AWS Management Console e apri la console Amazon Comprehend all'indirizzo https://console.aws.amazon.com/comprehend/

    2. Dal menu a sinistra, scegli Personalizzazione, quindi scegli Riconoscimento personalizzato delle entità.

    3. Scegli Crea nuovo modello.

    4. Assegna un nome al riconoscitore. Il nome deve essere univoco all'interno della regione e dell'account.

    5. Seleziona la lingua.

    6. In Tipo di entità personalizzato, inserisci un'etichetta personalizzata che desideri che il riconoscitore trovi nel set di dati.

      Il tipo di entità deve essere in lettere maiuscole e, se è composto da più di una parola, separale con un carattere di sottolineatura.

    7. Scegli Aggiungi tipo.

    8. Se desideri aggiungere un altro tipo di entità, inseriscilo e quindi scegli Aggiungi tipo. Se desideri rimuovere uno dei tipi di entità che hai aggiunto, scegli Rimuovi tipo, quindi scegli il tipo di entità da rimuovere dall'elenco. È possibile elencare un massimo di 25 tipi di entità.

    9. Per crittografare il tuo lavoro di formazione, scegli la crittografia Recognizer, quindi scegli se utilizzare una KMS chiave associata all'account corrente o una di un altro account.

      • Se utilizzi una chiave associata all'account corrente, per ID KMS chiave scegli l'ID della chiave.

      • Se utilizzi una chiave associata a un account diverso, come KMSchiave ARN inserisci ARN l'ID della chiave.

      Nota

      Per ulteriori informazioni sulla creazione e l'utilizzo KMS delle chiavi e sulla crittografia associata, vedere AWS Key Management Service.

    10. In Specifiche dei dati, scegli il formato dei tuoi documenti di formazione:

      • CSVfile: un CSV file che integra i documenti di formazione. Il CSV file contiene informazioni sulle entità personalizzate che il modello addestrato rileverà. Il formato richiesto del file dipende dal fatto che stiate fornendo annotazioni o un elenco di entità.

      • Augmented manifest: set di dati etichettato prodotto da Amazon Ground Truth SageMaker . Questo file è in JSON formato righe. Ogni riga è un JSON oggetto completo che contiene un documento di formazione e le relative etichette. Ogni etichetta annota un'entità denominata nel documento di formazione. È possibile fornire fino a 5 file manifest aumentati.

      Per ulteriori informazioni sui formati disponibili e per esempi, vedereAddestramento di modelli di riconoscimento di entità personalizzati.

    11. In Tipo di allenamento, scegli il tipo di allenamento da utilizzare:

      • Utilizzo di annotazioni e documenti di formazione

      • Utilizzo dell'elenco delle entità e dei documenti di formazione

      Se scegli le annotazioni, inserisci il file URL delle annotazioni in Amazon S3. Puoi anche accedere al bucket o alla cartella in Amazon S3 in cui si trovano i file di annotazione e scegliere Browse S3.

      Se scegli un elenco di entità, inserisci l'elenco URL delle entità in Amazon S3. Puoi anche accedere al bucket o alla cartella in Amazon S3 in cui si trova l'elenco delle entità e scegliere Browse S3.

    12. Inserisci un set URL di dati di input contenente i documenti di formazione in Amazon S3. Puoi anche accedere al bucket o alla cartella in Amazon S3 in cui si trovano i documenti di formazione e scegliere Seleziona cartella.

    13. In Set di dati di test seleziona come desideri valutare le prestazioni del tuo modello addestrato: puoi farlo sia per le annotazioni che per i tipi di addestramento con elenco di entità.

      • Autosplit: Autosplit seleziona automaticamente il 10% dei dati di formazione forniti da utilizzare come dati di test

      • (Facoltativo) Forniti dal cliente: quando si seleziona Fornito dal cliente, è possibile specificare esattamente quali dati di test si desidera utilizzare.

    14. Se selezioni Set di dati di test fornito dal cliente, inserisci il file URL delle annotazioni in Amazon S3. Puoi anche accedere al bucket o alla cartella in Amazon S3 in cui si trovano i file di annotazione e scegliere Seleziona cartella.

    15. Nella sezione Scegli un IAM ruolo, seleziona un IAM ruolo esistente o creane uno nuovo.

      • Scegli un IAM ruolo esistente: seleziona questa opzione se disponi già di un IAM ruolo con le autorizzazioni per accedere ai bucket di input e output di Amazon S3.

      • Crea un nuovo IAM ruolo: seleziona questa opzione se desideri creare un nuovo IAM ruolo con le autorizzazioni appropriate per Amazon Comprehend per accedere ai bucket di input e output.

        Nota

        Se i documenti di input sono crittografati, il IAM ruolo utilizzato deve disporre dell'autorizzazione. kms:Decrypt Per ulteriori informazioni, consulta Autorizzazioni necessarie per utilizzare la crittografia KMS.

    16. (Facoltativo) Per avviare le tue risorse in Amazon Comprehend da unVPC, inserisci l'VPCID sotto VPCo scegli l'ID dall'elenco a discesa.

      1. Scegli la sottorete in Subnet (s). Dopo aver selezionato la prima sottorete, è possibile sceglierne altre.

      2. In Gruppi di sicurezza, scegli il gruppo di sicurezza da utilizzare, se ne hai specificato uno. Dopo aver selezionato il primo gruppo di sicurezza, puoi sceglierne altri.

      Nota

      Quando si utilizza un processo VPC di riconoscimento delle entità personalizzato, l'operazione DataAccessRole utilizzata per le operazioni di creazione e avvio deve disporre delle autorizzazioni necessarie per VPC accedere ai documenti di input e al bucket di output.

    17. (Facoltativo) Per aggiungere un tag al riconoscimento di entità personalizzato, inserisci una coppia chiave-valore in Tag. Selezionare Aggiungi tag. Per rimuovere questa coppia prima di creare il riconoscitore, scegliete Rimuovi tag.

    18. Scegliete Treno.

    Il nuovo sistema di riconoscimento verrà quindi visualizzato nell'elenco, mostrandone lo stato. Verrà inizialmente visualizzato comeSubmitted. Verrà quindi visualizzato Training per un classificatore che sta elaborando documenti di formazione, Trained per un classificatore pronto all'uso e In error per un classificatore che presenta un errore. È possibile fare clic su un lavoro per ottenere ulteriori informazioni sul programma di riconoscimento, inclusi eventuali messaggi di errore.

    Per addestrare un riconoscitore di entità personalizzato con un testo semplice o un documento word PDF
    1. Accedi AWS Management Console e apri la console Amazon Comprehend.

    2. Dal menu a sinistra, scegli Personalizzazione, quindi scegli Riconoscimento personalizzato delle entità.

    3. Scegli Train Recognizer.

    4. Assegna un nome al riconoscitore. Il nome deve essere univoco all'interno della regione e dell'account.

    5. Seleziona la lingua. Nota: se stai addestrando un documento PDF o Word, l'inglese è la lingua supportata.

    6. In Tipo di entità personalizzato, inserisci un'etichetta personalizzata che desideri che il riconoscimento trovi nel set di dati.

      Il tipo di entità deve essere in lettere maiuscole e, se è composto da più di una parola, separale con un carattere di sottolineatura.

    7. Scegli Aggiungi tipo.

    8. Se desideri aggiungere un altro tipo di entità, inseriscilo e quindi scegli Aggiungi tipo. Se desideri rimuovere uno dei tipi di entità che hai aggiunto, scegli Rimuovi tipo, quindi scegli il tipo di entità da rimuovere dall'elenco. È possibile elencare un massimo di 25 tipi di entità.

    9. Per crittografare il tuo lavoro di formazione, scegli la crittografia Recognizer, quindi scegli se utilizzare una KMS chiave associata all'account corrente o una di un altro account.

      • Se utilizzi una chiave associata all'account corrente, per ID KMS chiave scegli l'ID della chiave.

      • Se utilizzi una chiave associata a un account diverso, come KMSchiave ARN inserisci ARN l'ID della chiave.

      Nota

      Per ulteriori informazioni sulla creazione e l'utilizzo KMS delle chiavi e sulla crittografia associata, vedere AWS Key Management Service.

    10. In Dati di addestramento, scegli Augmented manifest come formato dei dati:

      • Augmented manifest: è un set di dati etichettato prodotto da Amazon Ground Truth SageMaker . Questo file è in JSON formato righe. Ogni riga del file è un JSON oggetto completo che contiene un documento di formazione e le relative etichette. Ogni etichetta annota un'entità denominata nel documento di formazione. È possibile fornire fino a 5 file manifest aumentati. Se si utilizzano PDF documenti per i dati di addestramento, è necessario selezionare Augmented manifest. È possibile fornire fino a 5 file manifest aumentati. Per ogni file, puoi nominare fino a 5 attributi da utilizzare come dati di addestramento.

      Per ulteriori informazioni sui formati disponibili e per esempi, vedereAddestramento di modelli di riconoscimento di entità personalizzati.

    11. Seleziona il tipo di modello di allenamento.

      Se hai selezionato Documenti in testo semplice, in Posizione di input, inserisci il file manifesto Amazon URL S3 del file manifesto aumentato di SageMaker AIGround Amazon Truth. Puoi anche accedere al bucket o alla cartella in Amazon S3 in cui si trovano i manifesti aumentati e scegliere Seleziona cartella.

    12. In Nome dell'attributo, inserisci il nome dell'attributo che contiene le tue annotazioni. Se il file contiene annotazioni provenienti da più lavori di etichettatura concatenati, aggiungi un attributo per ogni lavoro. In questo caso, ogni attributo contiene l'insieme di annotazioni di un processo di etichettatura. Nota: è possibile fornire fino a 5 nomi di attributi per ogni file.

    13. Selezionare Aggiungi.

    14. Se hai selezionato PDFDocumenti Word in Posizione di input, inserisci Amazon S3 URL del file manifest aumentato Amazon SageMaker AI Ground Truth. Puoi anche accedere al bucket o alla cartella in Amazon S3 in cui si trovano i manifesti aumentati e scegliere Seleziona cartella.

    15. Inserisci il prefisso S3 per i tuoi file di dati di Annotation. Questi sono i PDF documenti che hai etichettato.

    16. Inserisci il prefisso S3 per i tuoi documenti Source. Questi sono i PDF documenti originali (oggetti dati) che hai fornito a Ground Truth per il tuo lavoro di etichettatura.

    17. Inserisci i nomi degli attributi che contengono le tue annotazioni. Nota: puoi fornire fino a 5 nomi di attributi per ogni file. Tutti gli attributi del file che non specifichi vengono ignorati.

    18. Nella sezione IAM ruolo, seleziona un IAM ruolo esistente o creane uno nuovo.

      • Scegli un IAM ruolo esistente: seleziona questa opzione se disponi già di un IAM ruolo con le autorizzazioni per accedere ai bucket di input e output di Amazon S3.

      • Crea un nuovo IAM ruolo: seleziona questa opzione se desideri creare un nuovo IAM ruolo con le autorizzazioni appropriate per Amazon Comprehend per accedere ai bucket di input e output.

        Nota

        Se i documenti di input sono crittografati, il IAM ruolo utilizzato deve disporre dell'autorizzazione. kms:Decrypt Per ulteriori informazioni, consulta Autorizzazioni necessarie per utilizzare la crittografia KMS.

    19. (Facoltativo) Per avviare le tue risorse in Amazon Comprehend da unVPC, inserisci l'VPCID sotto VPCo scegli l'ID dall'elenco a discesa.

      1. Scegli la sottorete in Subnet (s). Dopo aver selezionato la prima sottorete, è possibile sceglierne altre.

      2. In Gruppi di sicurezza, scegli il gruppo di sicurezza da utilizzare, se ne hai specificato uno. Dopo aver selezionato il primo gruppo di sicurezza, puoi sceglierne altri.

      Nota

      Quando si utilizza un processo VPC di riconoscimento delle entità personalizzato, l'operazione DataAccessRole utilizzata per le operazioni di creazione e avvio deve disporre delle autorizzazioni necessarie per VPC accedere ai documenti di input e al bucket di output.

    20. (Facoltativo) Per aggiungere un tag al riconoscimento di entità personalizzato, inserisci una coppia chiave-valore in Tag. Selezionare Aggiungi tag. Per rimuovere questa coppia prima di creare il riconoscitore, scegliete Rimuovi tag.

    21. Scegliete Treno.

    Il nuovo sistema di riconoscimento verrà quindi visualizzato nell'elenco, mostrandone lo stato. Verrà inizialmente visualizzato comeSubmitted. Verrà quindi visualizzato Training per un classificatore che sta elaborando documenti di formazione, Trained per un classificatore pronto all'uso e In error per un classificatore che presenta un errore. È possibile fare clic su un lavoro per ottenere ulteriori informazioni sul programma di riconoscimento, inclusi eventuali messaggi di errore.

    Creazione di un riconoscimento di entità personalizzato utilizzando la console - manifesto aumentato

    Per addestrare un riconoscitore di entità personalizzato con un testo semplice o un documento word PDF
    1. Accedi AWS Management Console e apri la console Amazon Comprehend.

    2. Dal menu a sinistra, scegli Personalizzazione, quindi scegli Riconoscimento personalizzato delle entità.

    3. Scegli Train Recognizer.

    4. Assegna un nome al riconoscitore. Il nome deve essere univoco all'interno della regione e dell'account.

    5. Seleziona la lingua. Nota: se stai addestrando un documento PDF o Word, l'inglese è la lingua supportata.

    6. In Tipo di entità personalizzato, inserisci un'etichetta personalizzata che desideri che il riconoscimento trovi nel set di dati.

      Il tipo di entità deve essere in lettere maiuscole e, se è composto da più di una parola, separale con un carattere di sottolineatura.

    7. Scegli Aggiungi tipo.

    8. Se desideri aggiungere un altro tipo di entità, inseriscilo e quindi scegli Aggiungi tipo. Se desideri rimuovere uno dei tipi di entità che hai aggiunto, scegli Rimuovi tipo, quindi scegli il tipo di entità da rimuovere dall'elenco. È possibile elencare un massimo di 25 tipi di entità.

    9. Per crittografare il tuo lavoro di formazione, scegli la crittografia Recognizer, quindi scegli se utilizzare una KMS chiave associata all'account corrente o una di un altro account.

      • Se utilizzi una chiave associata all'account corrente, per ID KMS chiave scegli l'ID della chiave.

      • Se utilizzi una chiave associata a un account diverso, come KMSchiave ARN inserisci ARN l'ID della chiave.

      Nota

      Per ulteriori informazioni sulla creazione e l'utilizzo KMS delle chiavi e sulla crittografia associata, vedere AWS Key Management Service.

    10. In Dati di addestramento, scegli Augmented manifest come formato dei dati:

      • Augmented manifest: è un set di dati etichettato prodotto da Amazon Ground Truth SageMaker . Questo file è in JSON formato righe. Ogni riga del file è un JSON oggetto completo che contiene un documento di formazione e le relative etichette. Ogni etichetta annota un'entità denominata nel documento di formazione. È possibile fornire fino a 5 file manifest aumentati. Se si utilizzano PDF documenti per i dati di addestramento, è necessario selezionare Augmented manifest. È possibile fornire fino a 5 file manifest aumentati. Per ogni file, puoi nominare fino a 5 attributi da utilizzare come dati di addestramento.

      Per ulteriori informazioni sui formati disponibili e per esempi, vedereAddestramento di modelli di riconoscimento di entità personalizzati.

    11. Seleziona il tipo di modello di allenamento.

      Se hai selezionato Documenti in testo semplice, in Posizione di input, inserisci il file manifesto Amazon URL S3 del file manifesto aumentato di SageMaker AIGround Amazon Truth. Puoi anche accedere al bucket o alla cartella in Amazon S3 in cui si trovano i manifesti aumentati e scegliere Seleziona cartella.

    12. In Nome dell'attributo, inserisci il nome dell'attributo che contiene le tue annotazioni. Se il file contiene annotazioni provenienti da più lavori di etichettatura concatenati, aggiungi un attributo per ogni lavoro. In questo caso, ogni attributo contiene l'insieme di annotazioni di un processo di etichettatura. Nota: è possibile fornire fino a 5 nomi di attributi per ogni file.

    13. Selezionare Aggiungi.

    14. Se hai selezionato PDFDocumenti Word in Posizione di input, inserisci Amazon S3 URL del file manifest aumentato Amazon SageMaker AI Ground Truth. Puoi anche accedere al bucket o alla cartella in Amazon S3 in cui si trovano i manifesti aumentati e scegliere Seleziona cartella.

    15. Inserisci il prefisso S3 per i tuoi file di dati di Annotation. Questi sono i PDF documenti che hai etichettato.

    16. Inserisci il prefisso S3 per i tuoi documenti Source. Questi sono i PDF documenti originali (oggetti dati) che hai fornito a Ground Truth per il tuo lavoro di etichettatura.

    17. Inserisci i nomi degli attributi che contengono le tue annotazioni. Nota: puoi fornire fino a 5 nomi di attributi per ogni file. Tutti gli attributi del file che non specifichi vengono ignorati.

    18. Nella sezione IAM ruolo, seleziona un IAM ruolo esistente o creane uno nuovo.

      • Scegli un IAM ruolo esistente: seleziona questa opzione se disponi già di un IAM ruolo con le autorizzazioni per accedere ai bucket di input e output di Amazon S3.

      • Crea un nuovo IAM ruolo: seleziona questa opzione se desideri creare un nuovo IAM ruolo con le autorizzazioni appropriate per Amazon Comprehend per accedere ai bucket di input e output.

        Nota

        Se i documenti di input sono crittografati, il IAM ruolo utilizzato deve disporre dell'autorizzazione. kms:Decrypt Per ulteriori informazioni, consulta Autorizzazioni necessarie per utilizzare la crittografia KMS.

    19. (Facoltativo) Per avviare le tue risorse in Amazon Comprehend da unVPC, inserisci l'VPCID sotto VPCo scegli l'ID dall'elenco a discesa.

      1. Scegli la sottorete in Subnet (s). Dopo aver selezionato la prima sottorete, è possibile sceglierne altre.

      2. In Gruppi di sicurezza, scegli il gruppo di sicurezza da utilizzare, se ne hai specificato uno. Dopo aver selezionato il primo gruppo di sicurezza, puoi sceglierne altri.

      Nota

      Quando si utilizza un processo VPC di riconoscimento delle entità personalizzato, l'operazione DataAccessRole utilizzata per le operazioni di creazione e avvio deve disporre delle autorizzazioni necessarie per VPC accedere ai documenti di input e al bucket di output.

    20. (Facoltativo) Per aggiungere un tag al riconoscimento di entità personalizzato, inserisci una coppia chiave-valore in Tag. Selezionare Aggiungi tag. Per rimuovere questa coppia prima di creare il riconoscitore, scegliete Rimuovi tag.

    21. Scegliete Treno.

    Il nuovo sistema di riconoscimento verrà quindi visualizzato nell'elenco, mostrandone lo stato. Verrà inizialmente visualizzato comeSubmitted. Verrà quindi visualizzato Training per un classificatore che sta elaborando documenti di formazione, Trained per un classificatore pronto all'uso e In error per un classificatore che presenta un errore. È possibile fare clic su un lavoro per ottenere ulteriori informazioni sul programma di riconoscimento, inclusi eventuali messaggi di errore.

    PrivacyCondizioni del sitoPreferenze cookie
    © 2025, Amazon Web Services, Inc. o società affiliate. Tutti i diritti riservati.