評估您的自訂訓練任務

評估配方是 YAML 組態檔案，可定義 Amazon Nova 模型評估任務的執行方式。使用此配方，您可以根據常見的基準或您自己的自訂資料集來評估基礎或訓練模型的效能。指標可以存放在 Amazon S3 或 TensorBoard 中。評估提供量化指標，協助您評估各種任務的模型效能，以判斷是否需要進一步自訂。

模型評估是一種離線程序，其中針對具有預先定義答案的固定基準測試模型。它們不會即時或針對即時使用者互動進行評估。對於即時評估，您可以透過呼叫 Amazon Bedrock 執行時間 APIs，在模型部署到 Amazon Bedrock 之後對其進行評估。

如需有關評估您訓練 Amazon Nova 模型的詳細說明，請參閱 SageMaker 使用者指南中的評估訓練模型一節。