Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Dokumentieren Sie institutionelles Wissen anhand von Spracheingaben mithilfe von Amazon Bedrock und Amazon Transcribe
Erstellt von Praveen Kumar Jeyarajan (AWS), Jundong Qiao (), Megan Wu () und Rajiv Upadhyay (AWS) AWS AWS
Code-Repository: genai-knowledge-capture | Umgebung: PoC oder Pilotprojekt | Technologien: Maschinelles Lernen und KI; Unternehmensproduktivität; CloudNative |
AWSDienste: Amazon Bedrock; AWS Lambda AWSCDK; Amazon; AWS Step FunctionsSNS; Amazon Transcribe |
Übersicht
Die Erfassung von institutionellem Wissen ist für den Erfolg und die Widerstandsfähigkeit von Unternehmen von größter Bedeutung. Institutionelles Wissen steht für das kollektive Wissen, die Erkenntnisse und die Erfahrungen, die Mitarbeiter im Laufe der Zeit gesammelt haben. Diese sind oft stillschweigend und werden informell weitergegeben. Diese Fülle an Informationen umfasst einzigartige Ansätze, bewährte Verfahren und Lösungen für komplizierte Probleme, die möglicherweise an anderer Stelle nicht dokumentiert sind. Durch die Formalisierung und Dokumentation dieses Wissens können Unternehmen das institutionelle Gedächtnis bewahren, Innovationen fördern, Entscheidungsprozesse verbessern und die Lernkurven neuer Mitarbeiter beschleunigen. Darüber hinaus fördert es die Zusammenarbeit, befähigt Einzelpersonen und fördert eine Kultur der kontinuierlichen Verbesserung. Letztlich hilft die Nutzung von institutionellem Wissen Unternehmen dabei, ihr wertvollstes Kapital — die kollektive Intelligenz ihrer Belegschaft — zu nutzen, um Herausforderungen zu bewältigen, Wachstum voranzutreiben und Wettbewerbsvorteile in dynamischen Geschäftsumgebungen zu wahren.
Dieses Muster erklärt, wie institutionelles Wissen mithilfe von Sprachaufzeichnungen von leitenden Mitarbeitern erfasst werden kann. Es verwendet Amazon Transcribe und Amazon Bedrock für die systematische Dokumentation und Überprüfung. Indem Sie dieses informelle Wissen dokumentieren, können Sie es bewahren und an nachfolgende Mitarbeiterkohorten weitergeben. Dieses Bestreben unterstützt betriebliche Exzellenz und verbessert die Effektivität von Schulungsprogrammen durch die Einbeziehung von praktischem Wissen, das durch direkte Erfahrung erworben wurde.
Voraussetzungen und Einschränkungen
Voraussetzungen
Ein aktives Konto AWS
AWSCloud Development Kit (AWSCDK) Version 2.114.1 oder höher, installiert und in die Regionen oder gebootet
us-east-1
us-west-2
AWSAWSBefehlszeilenschnittstelle (AWSCLI), installiert und konfiguriert
Berechtigungen zum Erstellen von Amazon Transcribe-, Amazon Bedrock-, Amazon Simple Storage Service (Amazon S3) und Lambda-Ressourcen AWS
Einschränkungen
Diese Lösung wird für ein einzelnes Konto bereitgestellt. AWS
Diese Lösung kann nur in AWS Regionen eingesetzt werden, in denen Amazon Bedrock und Amazon Transcribe verfügbar sind. Informationen zur Verfügbarkeit finden Sie in der Dokumentation für Amazon Bedrock und Amazon Transcribe.
Die Audiodateien müssen in einem Format vorliegen, das Amazon Transcribe unterstützt. Eine Liste der unterstützten Formate finden Sie unter Medienformate in der Transcribe-Dokumentation.
Produktversionen
AWSSDKfür Python (Boto3) Version 1.34.57 oder höher
LangChain Version 0.1.12 oder höher
Architektur
Die Architektur stellt einen serverlosen Workflow auf dar. AWS AWSStep Functions orchestriert Lambda-Funktionen für die Audioverarbeitung, Textanalyse und Dokumentgenerierung. Das folgende Diagramm zeigt den Step Functions Functions-Workflow, der auch als Zustandsmaschine bezeichnet wird.
Jeder Schritt in der Zustandsmaschine wird von einer eigenen Lambda-Funktion behandelt. Im Folgenden sind die Schritte im Prozess der Dokumentgenerierung aufgeführt:
Die
preprocess
Lambda-Funktion validiert die an Step Functions übergebenen Eingaben und listet alle Audiodateien auf, die im angegebenen Amazon S3 URI S3-Ordnerpfad vorhanden sind. Downstream-Lambda-Funktionen im Workflow verwenden die Dateiliste, um das Dokument zu validieren, zusammenzufassen und zu generieren.Die
transcribe
Lambda-Funktion verwendet Amazon Transcribe, um Audiodateien in Texttranskripte umzuwandeln. Diese Lambda-Funktion ist dafür verantwortlich, den Transkriptionsprozess einzuleiten und Sprache präzise in Text umzuwandeln, der dann für die nachfolgende Verarbeitung gespeichert wird.Die
validate
Lambda-Funktion analysiert die Texttranskripte und bestimmt die Relevanz der Antworten auf die ersten Fragen. Durch die Verwendung eines großen Sprachmodells (LLM) über Amazon Bedrock werden themenbezogene Antworten identifiziert und von themenfremden Antworten getrennt.Die
summarize
Lambda-Funktion verwendet Amazon Bedrock, um eine kohärente und präzise Zusammenfassung der themenbezogenen Antworten zu erstellen.Die
generate
Lambda-Funktion fasst die Zusammenfassungen zu einem gut strukturierten Dokument zusammen. Es kann das Dokument gemäß vordefinierten Vorlagen formatieren und alle zusätzlichen erforderlichen Inhalte oder Daten enthalten.Wenn eine der Lambda-Funktionen ausfällt, erhalten Sie eine E-Mail-Benachrichtigung über Amazon Simple Notification Service (AmazonSNS).
Während dieses Prozesses stellt AWS Step Functions sicher, dass jede Lambda-Funktion in der richtigen Reihenfolge initiiert wird. Diese Zustandsmaschine kann parallel verarbeitet werden, um die Effizienz zu erhöhen. Ein Amazon S3 S3-Bucket fungiert als zentrales Speicher-Repository und unterstützt den Arbeitsablauf durch die Verwaltung der verschiedenen beteiligten Medien- und Dokumentenformate.
Tools
AWSDienstleistungen
Amazon Bedrock ist ein vollständig verwalteter Service, der leistungsstarke Basismodelle (FMs) von führenden KI-Startups und Amazon für Ihre Nutzung über eine einheitliche Lösung zur Verfügung stellt. API
AWSLambda ist ein Rechendienst, mit dem Sie Code ausführen können, ohne Server bereitstellen oder verwalten zu müssen. Er führt Ihren Code nur bei Bedarf aus und skaliert automatisch, sodass Sie nur für die tatsächlich genutzte Rechenzeit zahlen.
Amazon Simple Notification Service (AmazonSNS) unterstützt Sie bei der Koordination und Verwaltung des Nachrichtenaustauschs zwischen Herausgebern und Kunden, einschließlich Webservern und E-Mail-Adressen.
Amazon Simple Storage Service (Amazon S3) ist ein cloudbasierter Objektspeicherservice, der Sie beim Speichern, Schützen und Abrufen beliebiger Datenmengen unterstützt.
AWSStep Functions ist ein serverloser Orchestrierungsdienst, mit dem Sie AWS Lambda-Funktionen und andere AWS Dienste kombinieren können, um geschäftskritische Anwendungen zu erstellen.
Amazon Transcribe ist ein automatischer Spracherkennungsdienst, der Modelle für maschinelles Lernen verwendet, um Audio in Text umzuwandeln.
Andere Tools
LangChain
ist ein Framework für die Entwicklung von Anwendungen, die auf großen Sprachmodellen basieren (LLMs).
Code-Repository
Der Code für dieses Muster ist im GitHub genai-knowledge-capture
Das Code-Repository enthält die folgenden Dateien und Ordner:
assets
Ordner — Die statischen Ressourcen für die Lösung, z. B. das Architekturdiagramm und der öffentliche Datensatzcode/lambdas
folder — Der Python-Code für alle Lambda-Funktionencode/lambdas/generate
folder — Der Python-Code, der aus den zusammengefassten Daten im S3-Bucket ein Dokument generiertcode/lambdas/preprocess
folder — Der Python-Code, der die Eingaben für die Step Functions Functions-Zustandsmaschine verarbeitetcode/lambdas/summarize
folder — Der Python-Code, der die transkribierten Daten mithilfe des Amazon Bedrock-Service zusammenfasstcode/lambdas/transcribe
folder — Der Python-Code, der Sprachdaten (Audiodatei) mithilfe von Amazon Transcribe in Text konvertiertcode/lambdas/validate
folder — Der Python-Code, der überprüft, ob sich alle Antworten auf dasselbe Thema beziehen
code/code_stack.py
— Die AWS CDK Konstrukt-Python-Datei, die zur Erstellung von AWS Ressourcen verwendet wirdapp.py
— Die AWS CDK App-Python-Datei, die zum Bereitstellen von AWS Ressourcen im AWS Zielkonto verwendet wirdrequirements.txt
— Die Liste aller Python-Abhängigkeiten, die installiert werden müssen für AWS CDKcdk.json
— Die Eingabedatei zur Bereitstellung von Werten, die zum Erstellen von Ressourcen erforderlich sind
Bewährte Methoden
Das bereitgestellte Codebeispiel dient nur proof-of-concept (PoC) oder Pilotzwecken. Wenn Sie die Lösung in der Produktion einsetzen möchten, wenden Sie die folgenden bewährten Methoden an:
Aktivieren Sie die Amazon S3 S3-Zugriffsprotokollierung
Aktivieren Sie VPCFlow Logs
Epen
Aufgabe | Beschreibung | Erforderliche Fähigkeiten |
---|---|---|
Exportieren Sie Variablen für das Konto und die AWS Region. | Führen Sie die folgenden Befehle aus, um mithilfe AWS CDK von Umgebungsvariablen AWS Anmeldeinformationen für bereitzustellen.
| AWS DevOps, DevOps Ingenieur |
Richten Sie das AWS CLI benannte Profil ein. | Folgen Sie den Anweisungen unter Konfiguration und Einstellungen der Anmeldeinformationsdatei, um das AWS CLI benannte Profil für das Konto einzurichten. | AWS DevOps, DevOps Ingenieur |
Aufgabe | Beschreibung | Erforderliche Fähigkeiten |
---|---|---|
Klonen Sie das Repo auf Ihre lokale Workstation. | Um das genai-knowledge-capture
| AWS DevOps, DevOps Ingenieur |
(Optional) Ersetzen Sie die Audiodateien. | Gehen Sie wie folgt vor, um die Beispielanwendung so anzupassen, dass sie Ihre eigenen Daten einbezieht:
| AWS DevOps, DevOps Ingenieur |
Richten Sie die virtuelle Python-Umgebung ein. | Führen Sie die folgenden Befehle aus, um die virtuelle Python-Umgebung einzurichten.
| AWS DevOps, DevOps Ingenieur |
Synthetisieren Sie den AWS CDK Code. | Führen Sie den folgenden Befehl aus, um den Code in eine AWS CloudFormation Stack-Konfiguration zu konvertieren.
| AWS DevOps, DevOps Ingenieur |
Aufgabe | Beschreibung | Erforderliche Fähigkeiten |
---|---|---|
Stellen Sie den Zugriff auf das Basismodell bereit. | Aktivieren Sie den Zugriff auf das Modell Anthropic Claude 3 Sonnet für Ihr AWS Konto. Anweisungen finden Sie in der Bedrock-Dokumentation unter Modellzugriff hinzufügen. | AWS DevOps |
Stellen Sie Ressourcen im Konto bereit. | Gehen Sie wie folgt vor AWSCDK, um Ressourcen im AWS Konto mithilfe von bereitzustellen:
| AWS DevOps, DevOps Ingenieur |
Abonnieren Sie das SNS Amazon-Thema. | Gehen Sie wie folgt vor, um das SNS Amazon-Thema für Benachrichtigungen zu abonnieren:
| Allgemein AWS |
Aufgabe | Beschreibung | Erforderliche Fähigkeiten |
---|---|---|
Führen Sie die Zustandsmaschine aus. |
| App-Entwickler, Allgemein AWS |
Aufgabe | Beschreibung | Erforderliche Fähigkeiten |
---|---|---|
Entfernen Sie die AWS Ressourcen. | Nachdem Sie die Lösung getestet haben, bereinigen Sie die Ressourcen:
| AWS DevOps, DevOps Ingenieur |
Zugehörige Ressourcen
AWSDokumentation
Ressourcen von Amazon Bedrock:
AWSCDKRessourcen:
AWSRessourcen für Step Functions:
Sonstige Ressourcen