Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Prima di iniziare un lavoro di personalizzazione del modello, è necessario preparare almeno un set di dati di addestramento. Il supporto di un set di dati di convalida e il formato del set di dati di formazione e convalida dipendono dai seguenti fattori.
-
Il tipo di lavoro di personalizzazione (messa a punto o formazione preliminare continua).
-
Le modalità di input e output dei dati.
Supporto del modello per la messa a punto e il formato dei dati di pre-addestramento continuo
La tabella seguente mostra i dettagli della messa a punto e del formato di dati di pre-allenamento continuo supportato per ogni rispettivo modello:
Nome modello | Ottimizzazione: ext-to-text | Ottimizzazione: & Text-to-image Image-to-embeddings | Ottimizzazione: testo+ e testo+video-testo Image-to-Text | Formazione preliminare continua: ext-to-text | Ottimizzazione: messaggistica a turno singolo | Ottimizzazione: messaggistica a turni multipli |
---|---|---|---|---|---|---|
Amazon Nova Pro | Sì | Sì | Sì | No | Sì | Sì |
Amazon Nova Lite | Sì | Sì | Sì | No | Sì | Sì |
Amazon NovaMicro | Sì | No | No | No | Sì | Sì |
Amazon Titan Text G1 - Express | Sì | No | No | Sì | No | No |
Amazon Titan Text G1 - Lite | Sì | No | No | Sì | No | No |
Amazon Titan Text Premier | Sì | No | No | No | No | No |
Amazon Titan Image Generator G1 V1 | Sì | Sì | No | No | No | No |
Amazon Titan Multimodal Embeddings G1 G1 | Sì | Sì | No | No | No | No |
Anthropic Claude 3 Haiku | No | No | No | No | Sì | Sì |
Cohere Command | Sì | No | No | No | No | No |
Cohere Command Light | Sì | No | No | No | No | No |
Meta Llama 2 13 B | Sì | No | No | No | No | No |
Meta Llama 2 70 B | Sì | No | No | No | No | No |
Per visualizzare le quote predefinite applicabili ai set di dati di formazione e convalida utilizzati per personalizzare diversi modelli, consulta la sezione Somma delle quote dei record di formazione e convalida negli endpoint Amazon Bedrock e nelle quote nel. Riferimenti generali di AWS
Prepara set di dati di formazione e convalida per il tuo modello personalizzato
Per preparare set di dati di addestramento e convalida per il modello personalizzato, create .jsonl
dei file, ogni riga dei quali è un oggetto JSON corrispondente a un record. I file creati devono essere conformi al formato del metodo e del modello di personalizzazione scelti e i record in essi contenuti devono essere conformi ai requisiti di dimensione.
Il formato dipende dal metodo di personalizzazione e dalla modalità di input e output del modello. Scegliete la scheda relativa al metodo preferito, quindi seguite i passaggi:
Per text-to-text i modelli, prepara un set di dati di formazione e convalida opzionale. Ogni oggetto JSON è un esempio contenente sia un campo che un prompt
campo. completion
Usa 6 caratteri per token come approssimazione del numero di token. Il formato è il seguente:
{"prompt": "<prompt1>", "completion": "<expected generated text>"}
{"prompt": "<prompt2>", "completion": "<expected generated text>"}
{"prompt": "<prompt3>", "completion": "<expected generated text>"}
Di seguito è riportato un elemento di esempio per un'attività di domanda-risposta:
{"prompt": "what is AWS", "completion": "it's Amazon Web Services"}
Seleziona una scheda per visualizzare i requisiti per i set di dati di addestramento e convalida per un modello:
Modello | Campioni minimi | Numero massimo di campioni | Lunghezza del contesto |
---|---|---|---|
Amazon Nova Micro | 100 | 20 km | 32 k |
Amazon Nova Lite | 8 | 20.000 (10.000 per documento) | 32 k |
Amazon Nova Pro | 100 | 10 k | 32 k |
Vincoli relativi a immagini e video
Dimensione massima del file di immagine | 10 MB |
Numero massimo di video | 1 per campione |
Lunghezza o durata massima del video | 90 secondi |
Dimensione massima del file video | 50 MB |
Formati di immagine supportati | PNG, JPEG, GIF, WEBP |
Formati video supportati | MOV, MKV, WEBM MP4 |
Per le linee guida sulla preparazione dei dati di Amazon Nova, consulta Linee guida per la preparazione dei dati per Amazon Nova.