Generative KI-Workload-Bewertung - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Generative KI-Workload-Bewertung

Tabby Ward und Deepak Dixit, Amazon Web Services ()AWS

November 2024 (Geschichte der Dokumente)

Die generative KI-Workload-Assessment ist eine strategische Methode zur Bewertung und Verbesserung der Bereitschaft eines Unternehmens, seine generativen KI-Workloads zu erstellen oder zu aktualisieren. Diese Bewertung ist wichtig, da die Integration generativer KI in den Geschäftsbetrieb die Funktionsweise der Dinge stark verändern und neue Effizienzen und Funktionen bieten kann. Um generative KI erfolgreich einzuführen, ist es jedoch unerlässlich, die aktuellen Systeme gründlich zu verstehen und einen klaren Plan für die future zu haben.

Generative KI-Workloads beziehen sich auf Rechenaufgaben, bei denen Modelle künstlicher Intelligenz verwendet werden, mit denen neue Inhalte wie Text, Bilder, Code oder andere Datentypen erstellt werden können. Diese Workloads erfordern in der Regel eine beträchtliche Rechenleistung, spezielle Hardware und große Datensätze für Training und Inferenz. GPUs Die Integration generativer KI-Workloads in den Betrieb bringt mehrere Herausforderungen mit sich:

  • Infrastrukturanforderungen: Bereitstellung der erheblichen Rechenressourcen und der speziellen Hardware, die für generative KI-Modelle erforderlich sind.

  • Datenmanagement: Sicherstellung von Datenqualität, Datenschutz und Compliance bei der Verarbeitung großer Datenmengen.

  • Qualifikationslücke: Mangelndes Fachwissen in KI-Technologien und Modellbereitstellung.

  • Ethische Überlegungen: Bekämpfung von Vorurteilen, Fairness und Transparenz bei KI-generierten Inhalten.

  • Komplexität der Integration: Nahtlose Integration generativer KI in bestehende Workflows und Altsysteme.

  • Kostenmanagement: Abwägen der potenziellen Vorteile mit den hohen Implementierungs- und Betriebskosten.

Die Bewältigung dieser Herausforderungen erfordert sorgfältige Planung, Investitionen in Infrastruktur und Talente sowie einen strategischen Umsetzungsansatz.

Zweck dieses Leitfadens

Generative KI wird in vielen Branchen schnell zu einer wichtigen Komponente. Sie bietet transformative Möglichkeiten, bringt aber auch Herausforderungen in Bezug auf Integration, Compliance und Skalierbarkeit mit sich. Viele Unternehmen haben aufgrund schwacher technologischer Grundlagen, Widerstand gegen Veränderungen und Datenqualitätsprobleme Schwierigkeiten, KI voll auszuschöpfen. Die generative KI-Workload-Assessment adressiert diese Herausforderungen, indem sie die Anforderungen für eine Modernisierung identifiziert, den Umfang der Implementierung definiert und bestehende Systeme und Denkweisen in Frage stellt. Es hilft Ihnen auch bei der Bestimmung von Produkten, die am wenigsten praktikabel sind (MVPs) und hilft Ihnen bei der Entwicklung einer Ziellösungsarchitektur, wodurch ein strukturierter und strategischer Ansatz für die Einführung von KI gewährleistet wird.

Dieser Leitfaden dient als strukturierter Ansatz, der Unternehmen dabei unterstützt, die Komplexität der Einführung generativer KI-Technologien zu bewältigen. Anstatt die Anforderungen von Anfang an klar zu definieren, hilft der Leitfaden bei:

  • Identifizierung potenzieller Anwendungsfälle für generative KI in Ihrem Unternehmen.

  • Bewertung der Bereitschaft Ihres Unternehmens für die Einführung generativer KI.

  • Definition und Verfeinerung von Zielen für Anwendungsfälle und ehrgeizige Ziele.

  • Festlegung des Umfangs und der Anforderungen für die Implementierung generativer KI.

  • Entwicklung einer Architektur für eine Ziellösung.

Zielgruppe und Vorteile

Diese Bewertung richtet sich speziell an Lösungsarchitekten, Unternehmensarchitekten und Anwendungsarchitekten, die die technischen Aspekte der generativen KI-Workload-Modernisierung bewerten möchten. Es ist auch nützlich für Programm- und Personalmanager, die die allgemeine Bereitschaft, die Ressourcenzuweisung und die Anforderungen an die Befähigung ihres Teams einschätzen möchten. Die bewährten Verfahren der Branche unterstreichen, wie wichtig eine umfassende Bewertung ist, um sicherzustellen, dass die Voraussetzungen für die Einführung von KI erfüllt sind. Dazu gehören die Bewertung von Architektur, Speicher, Compliance, Integration, Tests, Bereitstellung und Automatisierung.

Scope

Die folgenden Themen sind Gegenstand der generativen KI-Methode zur Bewertung der Arbeitslast:

  • Aktuelle generative KI-Technologien und -Modelle (z. B. große Sprachmodelle, Modelle zur Bilderzeugung)

  • Enge KI-Anwendungen, die generative Techniken verwenden

  • Integration generativer KI in bestehende Systeme und Workflows

  • Datenstrategien für das Training und die Feinabstimmung generativer KI-Modelle

  • Ethische Überlegungen und verantwortungsvolle KI-Praktiken für aktuelle generative KI-Anwendungen

  • Test- und Einsatzstrategien für generative KI in Produktionsumgebungen

  • Überlegungen zur Sicherheit und zum Datenschutz bei generativen KI-Implementierungen

  • Leistungsoptimierung und Skalierbarkeit generativer KI-Workloads

  • Anwendungsfälle und Anwendungen generativer KI in verschiedenen Branchen

  • Bewertung generativer KI-Ergebnisse und Qualitätssicherungsprozesse

Die folgenden Themen fallen nicht in den Geltungsbereich:

  • Szenarien mit künstlicher allgemeiner Intelligenz (AGI) und künstlicher Superintelligenz (ASI)

  • Spekulative future Fortschritte in der KI, die über aktuelle generative Modelle hinausgehen

  • Quantencomputer-Anwendungen in der KI

  • Neuromorphes Computing und Gehirn-Computer-Schnittstellen

  • Bewusstsein und Selbstbewusstsein in KI-Systemen

  • Langfristige gesellschaftliche Auswirkungen fortschrittlicher KI, die über aktuelle generative KI-Anwendungen hinausgehen

  • Regulatorische Rahmenbedingungen für hypothetische future KI-Technologien

  • Philosophische Debatten über die Natur von Intelligenz und Bewusstsein in Maschinen

  • Extreme Randfälle oder hochspekulative Anwendungsfälle von KI

  • Detaillierte technische Spezifikationen proprietärer KI-Modelle oder -Architekturen