데이터 세트 업데이트 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

데이터 세트 업데이트

초기 데이터 세트를 Amazon SageMaker Canvas로 가져온 후 데이터 세트에 추가하려는 추가 데이터가 있을 수 있습니다. 예를 들어, 매주 말에 데이터 세트에 추가하려는 인벤토리 데이터를 얻을 수 있습니다. 데이터를 여러 번 가져오는 대신 기존 데이터 세트를 업데이트하고 데이터 세트에 파일을 추가하거나 제거할 수 있습니다.

참고

로컬 업로드 또는 Amazon S3를 통해 가져온 데이터 세트만 업데이트할 수 있습니다.

데이터 세트를 수동 또는 자동으로 업데이트할 수 있습니다. 자동 데이터 세트 업데이트에 대한 자세한 내용은 섹션을 참조하세요데이터 세트 자동 업데이트 구성.

데이터 세트를 업데이트할 때마다 Canvas는 데이터 세트의 새 버전을 생성합니다. 모델을 구축하거나 예측을 생성하는 데에는 최신 버전의 데이터 세트만 사용할 수 있습니다. 데이터 세트의 버전 기록을 보는 방법에 대한 자세한 내용은 데이터 세트 세부 정보 보기을 참조하세요.

자동화된 일괄 예측과 함께 데이터 세트 업데이트를 사용할 수도 있습니다.이렇게 하면 데이터 세트를 업데이트할 때마다 배치 예측 작업이 시작됩니다. 자세한 내용은 SageMaker Canvas의 배치 예측 단원을 참조하십시오.

다음 섹션에서는 데이터 세트에 대한 수동 업데이트를 수행하는 방법을 설명합니다.

데이터 세트 수동 업데이트

수동 업데이트를 하려면 다음을 수행합니다.

  1. SageMaker Canvas 애플리케이션을 엽니다.

  2. 왼쪽 탐색 창에서 데이터 세트를 선택합니다.

  3. 데이터 세트 목록에서 업데이트하려는 데이터 세트를 선택합니다.

  4. 데이터 세트 업데이트 드롭다운 메뉴를 선택하고 수동 업데이트를 선택합니다. 이제 데이터 가져오기 워크플로로 이동하게 됩니다.

  5. 데이터 원본 드롭다운 메뉴에서 로컬 업로드 또는 Amazon S3를 선택합니다.

  6. 페이지에는 데이터 미리보기가 표시됩니다. 여기에서 데이터 세트에 파일을 추가하거나 제거할 수 있습니다. 테이블 형식 데이터를 가져오는 경우 새 파일의 스키마(열 이름 및 데이터 유형)가 기존 파일의 스키마와 일치해야 합니다. 또한 새 파일은 최대 데이터 세트 크기 또는 파일 크기를 초과해서는 안 됩니다. 이러한 제한에 대한 자세한 내용은 데이터 세트 가져오기를 참조하세요.

    참고

    데이터 세트에 있는 기존 파일과 이름이 같은 파일을 추가하면 새 파일이 파일의 이전 버전을 덮어씁니다.

  7. 변경사항을 저장할 준비가 되면 데이터 세트 업데이트를 선택합니다.

이제 데이터 세트의 새 버전이 생겼을 것입니다.

데이터 세트 페이지에서 버전 기록 탭을 선택하면 데이터 세트의 모든 버전과 수동 및 자동 업데이트 기록을 모두 볼 수 있습니다.