責任ある AI ツールキットとコンテンツモデレーション
責任ある AI ツールキット
Nova Forge は、トレーニングプロセス中にモデルを Amazon Nova の責任ある AI ガイドラインに合わせるためのトレーニングおよび評価データ、推論中にモデルレスポンスをモデレートするためのランタイムコントロールを含む、責任ある AI ツールキットを提供します。
トレーニングデータ – 責任ある AI の原則、安全上の考慮事項、責任あるテクノロジーのデプロイを強調するケースとシナリオは、継続的な事前トレーニング中にモデルを責任を持って調整するためにデータミキシングで利用できます。
評価 – 不適切、有害、または誤ったコンテンツを検出および拒否するモデルの能力をテストする評価は、ベースモデルのパフォーマンスとカスタムモデルのパフォーマンスの差を決定するベンチマークタスクとして利用できます。
ランタイムコントロール – デフォルトでは、Amazon Nova のランタイムは推論中に中程度のモデルレスポンスを制御します。このランタイムコントロールを変更するには、Amazon Web Services アカウントマネージャーに連絡して、Amazon Nova のカスタマイズ可能なコンテンツモデレーション設定をリクエストします。
安全性は、Amazon Web Services とそのユーザーの間で責任が共有されます。ベースモデルを変更するか、継続的な事前トレーニングを使用して特定のユースケースのパフォーマンスを向上させると、新しいモデルの安全性、公平性、その他の特性に影響を与える可能性があります。堅牢な適応方法により、モデルがカスタマイズされなかったタスクのモデルパフォーマンスへの影響を最小限に抑えながら、ベースモデルに組み込まれた安全性、公平性、その他の保護への変更を最小限に抑えます。テスト結果が安全性、公平性、その他の特性、および全体的な有効性に関する特定の期待を満たしているかどうかを判断するには、ユースケースを表すデータセットに対するアプリケーションのエンドツーエンドテストが必要です。詳細については、「Amazon Web Services の責任ある AI 使用ガイド」、「Amazon Web Services の責任ある AI ポリシー」、「Amazon Web Services の適正利用規約」、および「Amazon Web Services のサービス条件」を参照してください。
カスタマイズ可能なコンテンツモデレーション
カスタマイズ可能なコンテンツモデレーション設定 (CCMS) を使用すると、ビジネス要件に関連するコントロールを調整できると同時に、AI の責任ある使用を保証するための必須で設定不可能なコントロールを維持することができます。
これらの設定では、以下の 3 つの使用可能な設定を使用してコンテンツを生成できます。
セキュリティのみ
安全、機密性の高いコンテンツ、公平性の組み合わせ
すべてのカテゴリの組み合わせ
4 つのコンテンツモデレーションカテゴリは以下のとおりです。
-
安全 — 危険な活動、武器、規制物質をカバーします
-
機密性の高いコンテンツ — 冒涜、ヌード、いじめが含まれます
-
公平性 — バイアスと文化的考慮事項を扱います
-
セキュリティ — サイバー犯罪、マルウェア、悪意のあるコンテンツが含まれます
CCMS の設定に関係なく、Amazon Nova は、児童への危害を防ぎ、プライバシーを維持するためのコントロールなど、AI の責任ある使用を確保するために、必須で設定不可能なコントロールを適用します。
CCMS を使用する場合は、完全に調整された本番環境用チェックポイントではなく、継続的な事前トレーニング (CPT) を使用し、事前 RAI アライメントチェックポイント (部分的または完全に事前トレーニングされたテキストのみ) から開始することをお勧めします。これらのチェックポイントは、安全トレーニングを受けたり、特定の RAI 動作に誘導されたりしていないため、コンテンツモデレーション要件に合わせてより効率的にカスタマイズできます。
ヒント
データミキシングで CCMS を使用する場合は、特定のコンテンツモデレーション要件に合わせて nova_data 設定の「RAI」カテゴリの割合を調整することを検討してください。
利用可能な状況
CCMS は現在、以下を使用する承認済みのお客様にご利用いただけます。
Amazon Nova Lite 1.0 および Pro 1.0 モデル
Amazon Bedrock オンデマンド推論
us-east-1 (バージニア北部) リージョン
Forge モデルの CCMS を有効にするには、Amazon Web Services アカウントマネージャーにお問い合わせください。