ドメイン適応の微調整 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ドメイン適応の微調整

ドメイン適応の微調整により、事前トレーニング済みの基盤モデルを活用し、限られたドメイン固有データを使用して特定のタスクに適応させることができます。プロンプトエンジニアリング作業では十分なカスタマイズができない場合は、ドメイン適応の微調整を使用して、業界用語、専門用語、その他の特殊データなど、ドメイン固有の言語でモデルを動作させることができます。この微調整プロセスにより、モデルの重みが変わります。

ドメイン適応の微調整は、以下の基盤モデルで利用できます。

注記

Llama 2 7B などの一部の JumpStart 基盤モデルでは、微調整と推論の実行の前にエンドユーザーライセンス契約の承諾が必要です。詳細については、「エンドユーザーライセンス契約」を参照してください。

  • ブルーム 3B

  • ブルーム 7B1

  • BloomZ 3B FP16

  • BloomZ 7B1 FP16

  • GPT-2 XL

  • GPT-J 6B

  • GPT-Neo 1.3B

  • GPT-Neo 125M

  • GPT-NEO 2.7B

  • ラマ 2 13B

  • ラマ 2 13B チャット

  • ラマ 2 13B Neuron

  • ラマ 2 70B

  • Llama 2 70B チャット

  • ラマ 2 7B

  • Llama 2 7B チャット

  • ラマ 2 7B ニューロン

ドメイン適応の微調整のためのトレーニングデータの準備とアップロード

ドメイン適応の微調整のためのトレーニングデータは、CSV、JSON、または TXT ファイル形式で提供できます。すべてのトレーニングデータは、1 つのフォルダ内の 1 つのファイルに存在する必要があります。

トレーニングデータは、CSV または JSON トレーニングデータファイルのテキスト列から取得されます。テキスト というラベルが付いた列がない場合、トレーニングデータは CSV または JSON トレーニングデータファイルの最初の列から取得されます。

以下は、微調整に使用する TXT ファイルの本文の例です。

This report includes estimates, projections, statements relating to our business plans, objectives, and expected operating results that are “forward- looking statements” within the meaning of the Private Securities Litigation Reform Act of 1995, Section 27A of the Securities Act of 1933, and Section 21E of ....

トレーニングとテストのためのデータの分割

オプションで、検証データを含む別のフォルダを指定できます。このフォルダには、CSV、JSON、または TXT ファイルが 1 つ含まれている必要があります。検証データセットが指定されていない場合、一定の量のトレーニングデータが検証目的で確保されます。モデルの微調整のためにハイパーパラメータを選択すると、検証に使用されるトレーニングデータの割合を調整できます。

微調整データを Amazon S3 にアップロードする

準備したデータを Amazon Simple Storage Service (Amazon S3) にアップロードして、 JumpStart 基盤モデルの微調整に使用します。次のコマンドを使用してデータをアップロードできます。

from sagemaker.s3 import S3Uploader import sagemaker import random output_bucket = sagemaker.Session().default_bucket() local_data_file = "train.txt" train_data_location = f"s3://{output_bucket}/training_folder" S3Uploader.upload(local_data_file, train_data_location) S3Uploader.upload("template.json", train_data_location) print(f"Training data: {train_data_location}")

命令ベースの微調整のためのトレーニングジョブを作成する

データが Amazon S3 にアップロードされたら、基盤モデルを JumpStart微調整してデプロイできます。Studio でモデルを微調整するには、「」を参照してくださいStudio で基盤モデルを微調整する。SDK を使用してモデルを SageMaker Python微調整するには、「」を参照してくださいJumpStartEstimator クラスで公開されている基盤モデルを微調整する

サンプルノートブックの例

ドメイン適応の微調整の詳細については、次のサンプルノートブックを参照してください。