テスト - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

テスト

質問

レスポンスの例

テスト要件 (ユニットテスト、統合テスト、end-to-endテストなど) は何ですか?

個々のコンポーネントのユニットテスト、外部システムとの統合テスト、重要なシナリオのend-to-endテストなど。

生成 AI トレーニングのために、さまざまなソース間でデータの品質と一貫性を確保するにはどうすればよいですか?

自動データプロファイリングツール、定期的なデータ監査、一元化されたデータカタログを通じてデータ品質を維持します。ソース間の一貫性を確保し、データリネージを維持するために、データガバナンスポリシーを実装しました。

生成 AI モデルはどのように評価および検証されますか?

ホールドアウトデータセット、人間による評価、A/B テストなどを使用します。

生成 AI モデルのパフォーマンスと精度を評価するための基準は何ですか?

精度、再現率、F1 スコア、多重度、人間による評価など。

エッジケースとコーナーケースはどのように識別され、処理されますか?

包括的なテストスイート、人間による評価、攻撃者によるテストなどを使用します。

生成 AI モデルの潜在的なバイアスをどのようにテストしますか?

人口統計パリティ分析、等価機会テスト、敵対的偏見排除手法、反事実テストなどを使用します。

モデルの出力の公平性を測定するために使用されるメトリクスはどれですか?

異なる影響率、均等化されたオッズ、属性パリティ、個々の公平性メトリクスなど。

バイアス検出のためにテストデータセットで多様な表現を確保するにはどうすればよいですか?

属性グループ間の層別サンプリング、多様性の専門家とのコラボレーション、合成データを使用してギャップを埋めるなど。

デプロイ後のモデルの公平性を継続的にモニタリングするには、どのプロセスを実装しますか?

定期的な公平性監査、自動バイアス検出システム、ユーザーフィードバック分析、更新されたデータセットを使用した定期的な再トレーニングなど。

生成 AI モデルの交差バイアスにどのように対処しますか?

交差公平性分析、サブグループテスト、交差性に関するドメインエキスパートとのコラボレーションなどを使用します。

さまざまな言語や文化的コンテキストでモデルのパフォーマンスをどのようにテストしますか?

多言語テストセット、文化専門家とのコラボレーション、ローカライズされた公平性メトリクス、異文化比較研究などを活用します。