Integrazione di un carico di lavoro cloud tradizionale con Amazon Bedrock - AWS Guida prescrittiva

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Integrazione di un carico di lavoro cloud tradizionale con Amazon Bedrock

Lo scopo di questo caso d'uso è dimostrare un carico di lavoro cloud tradizionale integrato con Amazon Bedrock per sfruttare le funzionalità di intelligenza artificiale generativa. Il diagramma seguente illustra l'account Generative AI insieme a un account applicativo di esempio. 

Integrazione di un carico di lavoro cloud tradizionale con Amazon Bedrock

L'account Generative AI è dedicato a fornire funzionalità di intelligenza artificiale generativa utilizzando Amazon Bedrock. L'account Application è un esempio di carico di lavoro. I servizi AWS che usi in questo account dipendono dai tuoi requisiti. Le interazioni tra l'account Generative AI e l'account Application utilizzano le API Amazon Bedrock. 

L'account dell'applicazione è separato dall'account Generative AI per aiutare a raggruppare i carichi di lavoro in base agli scopi aziendali e alla proprietà. Ciò aiuta a limitare l'accesso ai dati sensibili nell'ambiente di intelligenza artificiale generativa e supporta l'applicazione di controlli di sicurezza distinti per ambiente. Mantenere il tradizionale carico di lavoro sul cloud in un account separato aiuta anche a limitare la portata dell'impatto degli eventi avversi

Puoi creare e scalare applicazioni di intelligenza artificiale generativa aziendali in base a vari casi d'uso supportati da Amazon Bedrock. Alcuni casi d'uso comuni sono la generazione di testo, l'assistenza virtuale, la ricerca di testo e immagini, il riepilogo del testo e la generazione di immagini. A seconda del caso d'uso, il componente dell'applicazione interagisce con una o più funzionalità di Amazon Bedrock come knowledge base e agenti. 

Account dell'applicazione

L'account dell'applicazione ospita l'infrastruttura e i servizi principali per l'esecuzione e la manutenzione di un'applicazione aziendale. In questo contesto, l'account Application funge da tradizionale carico di lavoro cloud, che interagisce con il servizio gestito Amazon Bedrock nell'account Generative AI. Consulta la sezione relativa all'account dell'applicazione Workload OU per le best practice di sicurezza generali per proteggere questo account. 

Le migliori pratiche standard di sicurezza delle applicazioni si applicano come in altre applicazioni. Se si prevede di utilizzare il retrieval augmented generation (RAG), in cui l'applicazione richiede le informazioni pertinenti da una knowledge base, ad esempio un database vettoriale, utilizzando un prompt di testo inviato dall'utente, l'applicazione deve propagare l'identità dell'utente alla knowledge base e la knowledge base applica i controlli di accesso basati su ruoli o attributi.

Un altro modello di progettazione per le applicazioni di intelligenza artificiale generativa consiste nell'utilizzare agenti per orchestrare le interazioni tra un modello di base (FM), fonti di dati, basi di conoscenza e applicazioni software. Gli agenti chiamano le API per intraprendere azioni per conto dell'utente che interagisce con il modello. Il meccanismo più importante da adottare è assicurarsi che ogni agente diffonda l'identità dell'utente dell'applicazione ai sistemi con cui interagisce. È inoltre necessario assicurarsi che ogni sistema (origine dati, applicazione e così via) comprenda l'identità dell'utente, limiti le proprie risposte alle azioni che l'utente è autorizzato a eseguire e risponda con dati a cui l'utente è autorizzato ad accedere.

È inoltre importante limitare l'accesso diretto agli endpoint di inferenza del modello pre-addestrato utilizzati per generare inferenze. Desideri limitare l'accesso agli endpoint di inferenza per controllare i costi e monitorare l'attività. Se i tuoi endpoint di inferenza sono ospitati su AWS, ad esempio con i modelli base di Amazon Bedrock, puoi utilizzare IAM per controllare le autorizzazioni per richiamare azioni di inferenza. 

Se la tua applicazione AI è disponibile per gli utenti come applicazione Web, devi proteggere la tua infrastruttura utilizzando controlli come i firewall delle applicazioni Web. Le minacce informatiche tradizionali, come le iniezioni SQL e i request flood, potrebbero essere possibili contro la tua applicazione. Poiché le chiamate all'applicazione provocano invocazioni delle API di inferenza del modello e le chiamate API di inferenza del modello sono generalmente a pagamento, è importante mitigare le inondazioni per ridurre al minimo gli addebiti imprevisti da parte del provider FM. I firewall delle applicazioni Web non proteggono dalle minacce di iniezione rapida, poiché tali minacce si presentano sotto forma di testo in linguaggio naturale. I firewall associano il codice (ad esempio HTML, SQL o espressioni regolari) laddove risulta inaspettato (testo, documenti e così via). Per proteggerti dagli attacchi di iniezione immediata e garantire la sicurezza del modello, utilizza i guardrail. 

La registrazione e il monitoraggio dell'inferenza nei modelli di intelligenza artificiale generativa sono fondamentali per mantenere la sicurezza e prevenire gli abusi. Consente l'identificazione di potenziali attori di minacce, attività dannose o accessi non autorizzati e consente un intervento tempestivo e la mitigazione dei rischi associati all'implementazione di questi potenti modelli.

Account AI generativo

A seconda del caso d'uso, l'account Generative AI ospita tutte le attività di intelligenza artificiale generativa. Queste includono, a titolo esemplificativo, l'invocazione del modello, il RAG, gli agenti e gli strumenti e la personalizzazione del modello. Consultate le sezioni precedenti che illustrano casi d'uso specifici per scoprire quali funzionalità e implementazioni sono necessarie per il vostro carico di lavoro. 

Le architetture presentate in questa guida offrono un framework completo per le organizzazioni che utilizzano i servizi AWS per sfruttare le funzionalità di intelligenza artificiale generativa in modo sicuro ed efficiente. Queste architetture combinano la funzionalità completamente gestita di Amazon Bedrock con le migliori pratiche di sicurezza per fornire una solida base per l'integrazione dell'IA generativa nei carichi di lavoro e nei processi organizzativi tradizionali del cloud. I casi d'uso specifici coperti, tra cui la fornitura di AI FM generativi, RAG, agenti e personalizzazione dei modelli, riguardano un'ampia gamma di potenziali applicazioni e scenari. Queste linee guida forniscono alle organizzazioni la comprensione necessaria dei servizi AWS Bedrock e dei relativi controlli di sicurezza intrinseci e configurabili, consentendo loro di prendere decisioni informate su misura in base alla loro infrastruttura, alle applicazioni e ai requisiti di sicurezza unici.