Architektur - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Architektur

Frage

Beispielantwort

Welche Art von generativem KI-Modell oder Architektur wird in Betracht gezogen?

Transformator, konvolutionelles neuronales Netzwerk (CNN), rekurrentes neuronales Netzwerk (RNN), Entscheidungsbäume usw.

Was ist der erwartete Umfang oder das erwartete Volumen von Daten und Berechnungen?

Millionen von Benutzern, Petabyte an Daten und so weiter.

Was sind die Hardwareanforderungen (zum Beispiel CPUs oder GPUs) für Training und Inferenz?

High-End GPUs, CPU-Cluster, Cloud-Instanzen usw.

Wie wird das generative KI-Modell im Laufe der Zeit aktualisiert oder neu trainiert?

Durch kontinuierliches Lernen, regelmäßige Umschulungen, manuelle Updates usw.

Was sind die Anforderungen an die Datenvorverarbeitung und das Feature-Engineering?

Textreinigung, Bildvergrößerung, Funktionsauswahl usw.

Wie wird das generative KI-System mit Grenzfällen, Ausreißern oder Eingaben mit geringer Zuverlässigkeit umgehen?

Durch Rückgriff auf menschliche Aufsicht, Anfragen zur Klärung usw.

Was sind die Latenzanforderungen für die generative KI-Anwendung?

Stapelverarbeitung in Echtzeit, nahezu in Echtzeit usw.