도메인 적응 미세 조정 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

도메인 적응 미세 조정

도메인 적응 미세 조정을 통해 사전 훈련된 파운데이션 모델을 활용하고 제한된 도메인별 데이터를 사용하여 특정 작업에 적응할 수 있습니다. 프롬프트 엔지니어링 노력으로도 충분한 사용자 지정이 이루어지지 않는 경우, 도메인 적응 미세 조정을 사용하여 산업 용어, 기술 용어 또는 기타 특수 데이터와 같은 도메인별 언어를 사용하여 모델을 작동시킬 수 있습니다. 이 미세 조정 프로세스는 모델의 가중치를 수정합니다.

도메인 적응 미세 조정은 다음 파운데이션 모델에서 사용할 수 있습니다.

참고

Lama 2 7B와 같은 일부 JumpStart 기초 모델은 미세 조정 및 추론 수행 전에 최종 사용자 라이선스 계약에 동의해야 합니다. 자세한 정보는 최종 사용자 라이선스 계약을 참조하세요.

  • 블룸 3B

  • 블룸 7B1

  • 블룸즈 3B FP16

  • 블룸즈 7B1 FP16

  • GPT-2 XL

  • GOT-J 6B

  • GPT-Neo 1.3B

  • GPT-Neo 125M

  • GPT-NEO 2.7B

  • 라마 2 13B

  • 라마 2 13B 채팅

  • 라마 2 13B 뉴런

  • 라마 2 70B

  • 라마 2 70B 채팅

  • 라마 2 7B

  • 라마 2 7B 채팅

  • 라마 2 7B 뉴런

도메인 적응 미세 조정을 위한 훈련 데이터 준비 및 업로드

도메인 적응 미세 조정을 위한 교육 데이터는 CSV, JSON 또는 TXT 파일 형식으로 제공할 수 있습니다. 모든 교육 데이터는 단일 폴더 내의 단일 파일에 있어야 합니다.

교육 데이터는 CSV 또는 JSON 교육 데이터 파일의 텍스트 열에서 가져옵니다. 텍스트 레이블이 지정된 열이 없는 경우 CSV 또는 JSON 교육 데이터 파일의 경우 첫 번째 열에서 교육 데이터를 가져옵니다.

다음은 미세 조정에 사용되는 TXT 파일의 예제 본문입니다.

This report includes estimates, projections, statements relating to our business plans, objectives, and expected operating results that are “forward- looking statements” within the meaning of the Private Securities Litigation Reform Act of 1995, Section 27A of the Securities Act of 1933, and Section 21E of ....

훈련 및 테스트를 위해 데이터를 분할합니다.

선택적으로 검증 데이터가 들어 있는 다른 폴더를 제공할 수 있습니다. 이 폴더에는 CSV, JSON 또는 TXT 파일도 한 개 포함되어야 합니다. 검증 데이터셋이 제공되지 않는 경우 검증을 위해 일정량의 훈련 데이터가 따로 보관됩니다. 모델 미세 조정을 위한 하이퍼파라미터를 선택할 때 검증에 사용되는 훈련 데이터의 비율을 조정할 수 있습니다.

미세 조정 데이터를 Amazon S3에 업로드

준비된 데이터를 Amazon 심플 스토리지 서비스 (Amazon S3) 에 업로드하여 기초 모델을 미세 JumpStart 조정할 때 사용할 수 있습니다. 다음 명령을 사용하여 데이터를 업로드할 수 있습니다.

from sagemaker.s3 import S3Uploader import sagemaker import random output_bucket = sagemaker.Session().default_bucket() local_data_file = "train.txt" train_data_location = f"s3://{output_bucket}/training_folder" S3Uploader.upload(local_data_file, train_data_location) S3Uploader.upload("template.json", train_data_location) print(f"Training data: {train_data_location}")

명령 기반 미세 조정을 위한 교육 작업 생성

Amazon S3에 데이터를 업로드한 후에는 JumpStart 기초 모델을 미세 조정하고 배포할 수 있습니다. Studio에서 모델을 미세 조정하려면 을 참조하십시오. Studio에서 기초 모델을 미세 조정합니다. SDK를 사용하여 모델을 미세 조정하려면 을 참조하십시오. SageMaker Python 공개적으로 사용 가능한 기초 모델을 학급에 맞게 미세 조정하십시오. JumpStartEstimator

예제 노트북

도메인 적응 미세 조정에 대한 자세한 내용은 다음 예제 노트북을 참조하십시오.