生成 AI ワークロード評価 - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

生成 AI ワークロード評価

Tabby Ward と Deepak Dixit、Amazon Web Services (AWS)

2024 年 11 月 (ドキュメント履歴

生成 AI ワークロード評価は、生成 AI ワークロードを作成または更新する組織の準備状況を評価し、改善するための戦略的方法です。この評価は重要です。生成 AI をビジネスオペレーションに組み込むと、モノの仕組みが大きく変化し、新しい効率と機能を提供できるからです。ただし、生成 AI を正常に採用するには、現在のシステムを徹底的に理解し、将来の明確な計画を立てることが重要です。

生成 AI ワークロードとは、テキスト、画像、コード、その他のデータ型などの新しいコンテンツを作成できる人工知能モデルの使用を伴う計算タスクを指します。これらのワークロードには、通常、大量のコンピューティング能力、GPUs などの特殊なハードウェア、トレーニングと推論のための大規模なデータセットが必要です。生成 AI ワークロードをオペレーションに統合するには、いくつかの課題があります。

  • インフラストラクチャ要件: 生成 AI モデルに必要な重要な計算リソースと特殊なハードウェアのプロビジョニング。

  • データ管理: 大規模なデータセットを処理しながら、データの品質、プライバシー、コンプライアンスを確保します。

  • スキルギャップ: AI テクノロジーとモデルのデプロイに関する専門知識の欠如。

  • 倫理的考慮事項: AI 生成コンテンツのバイアス、公平性、透明性に対処します。

  • 統合の複雑さ: 生成 AI を既存のワークフローとレガシーシステムにシームレスに組み込む。

  • コスト管理: 実装と運用の高いコストと潜在的な利点のバランスを取ります。

これらの課題を克服するには、慎重な計画、インフラストラクチャと人材への投資、実装への戦略的アプローチが必要です。

このガイドの目的

生成 AI は、多くの業界で急速に重要なコンポーネントとなっています。変革の機会を提供しますが、統合、コンプライアンス、スケーラビリティに関しても課題があります。多くの組織は、技術基盤の弱さ、変化への抵抗、データ品質の問題により、AI のフル活用に苦労しています。生成 AI ワークロード評価は、モダナイゼーションの要件を特定し、実装の範囲を定義し、レガシーシステムと思考に挑戦することで、これらの課題に対処します。また、最小限の実行可能な製品 (MVPs) を決定し、ターゲットソリューションアーキテクチャを開発して、AI 導入への構造化された戦略的アプローチを確保するのに役立ちます。

このガイドは、組織が生成 AI テクノロジーを採用する複雑さを克服するのに役立つ構造化されたアプローチとして機能します。このガイドは、最初から要件を明確に定義するのではなく、以下を支援します。

  • 組織内の生成 AI の潜在的なユースケースを特定します。

  • 生成 AI の導入に向けた組織の準備状況を評価します。

  • ユースケース目標とストレッチ目標の定義と改善。

  • 生成 AI 実装の範囲と要件を決定します。

  • ターゲットソリューションアーキテクチャの開発。

対象者と利点

この評価は、生成 AI ワークロードのモダナイゼーションの技術的側面を評価したいソリューションアーキテクト、エンタープライズアーキテクト、アプリケーションアーキテクト向けに特別に設計されています。また、チームの全体的な準備状況、リソースの割り当て、有効化要件を計測したいプログラムマネージャーや人事マネージャーにとっても役立ちます。業界のベストプラクティスは、AI 導入の準備を整えるための包括的な評価の重要性を強調しています。これには、アーキテクチャ、ストレージ、コンプライアンス、統合、テスト、デプロイ、自動化の評価が含まれます。

スコープ

以下のトピックは、生成 AI ワークロード評価方法の対象です。

  • 現在の生成 AI テクノロジーとモデル (大規模言語モデル、イメージ生成モデルなど)

  • 生成技術を使用する狭い AI アプリケーション

  • 生成 AI と既存のシステムやワークフローの統合

  • 生成 AI モデルのトレーニングと微調整のためのデータ戦略

  • 現在の生成 AI アプリケーションの倫理的考慮事項と責任ある AI プラクティス

  • 本番環境における生成 AI のテストとデプロイ戦略

  • 生成 AI 実装のセキュリティとプライバシーに関する考慮事項

  • 生成 AI ワークロードのパフォーマンスの最適化とスケーラビリティ

  • さまざまな業界における生成 AI のユースケースとアプリケーション

  • 生成 AI 出力と品質保証プロセスの評価

以下のトピックは対象外です。

  • 人工知能 (AGI) と人工知能 (ASI) のシナリオ

  • 現在の生成モデルを超える AI の投機的未来の進歩

  • AI の量子コンピューティングアプリケーション

  • ニューロモーフィックコンピューティングとブレインコンピュータインターフェイス

  • AI システムの意識と自己認識

  • 現在の生成 AI アプリケーションを超える高度な AI の長期的な社会的影響

  • 架空の将来の AI テクノロジーの規制フレームワーク

  • 機械における知性と意識の本質に関する哲学的議論

  • AI の極端なエッジケースまたは高度に投機的なユースケース

  • 独自の AI モデルまたはアーキテクチャの詳細な技術仕様