오프라인 저장소 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

오프라인 저장소

오프라인 저장소는 1초 미만의 검색이 필요하지 않는 과거 데이터에 사용됩니다. 일반적으로 데이터 탐색, 모델 훈련 및 일괄 추론에 사용됩니다.

특성 그룹에 대해 온라인 저장소와 오프라인 저장소를 모두 활성화하면 두 저장소가 모두 동기화되어 훈련 데이터와 제공 데이터 간의 불일치를 피할 수 있습니다. InMemory 스토리지 유형이 활성화된 온라인 저장소 특성 그룹은 현재 오프라인 저장소에서 해당 특성 그룹을 지원하지 않습니다(온라인-오프라인 복제 불가). Amazon SageMaker Feature Store에서 제공하는 ML 모델에 대한 자세한 내용은 섹션을 참조하세요온라인 저장소.

오프라인 저장소에는 다음 TableFormat옵션이 있습니다. 오프라인 스토어 콘텐츠에 대한 자세한 내용은 Amazon SageMaker API 참조OfflineStoreConfig의 섹션을 참조하세요.

Glue 테이블 형식

Glue 형식(기본값)은 AWS Glue를 위한 표준 Hive 유형 테이블 형식입니다. 를 사용하면 여러 소스에서 데이터를 검색, 준비, 이동 및 통합할 AWS Glue수 있습니다. 또한 작성, 작업 실행, 비즈니스 워크플로 구현을 위한 추가 생산성 및 데이터 운영 도구도 포함됩니다. 에 대한 자세한 내용은 란 무엇입니까 AWS Glue?를 AWS Glue참조하세요.

Iceberg 테이블 형식

Iceberg 형식(권장)은 대규모 분석 테이블에 대한 오픈 테이블 형식입니다. Iceberg를 사용하면 작은 데이터 파일을 파티션에 있는 더 적은 수의 큰 파일로 압축하여 쿼리 속도를 크게 높일 수 있습니다. 이 압축 작업은 동시에 수행되며 특성 그룹에서 진행 중인 읽기 및 쓰기 작업에는 영향을 주지 않습니다. Iceberg 테이블 최적화에 대한 자세한 내용은 Amazon AthenaAWS Lake Formation 사용 설명서를 참조하세요.

Iceberg는 대규모 파일 컬렉션을 테이블로 관리하고 최신 분석 데이터 레이크 작업을 지원합니다. 새 특성 그룹을 생성할 때 Iceberg 옵션을 선택하면 Amazon SageMaker Feature Store는 Parquet 파일 형식을 사용하여 Iceberg 테이블을 생성하고 에 테이블을 등록합니다 AWS Glue Data Catalog. Iceberg 테이블 형식에 대한 자세한 내용은 Apache Iceberg 테이블 사용을 참조하세요.

중요

Iceberg 테이블 형식의 특성 그룹의 경우, 이벤트 시간의 특성 유형을 String으로 지정해야 함에 유의하세요. 다른 유형을 지정하면 특성 그룹을 성공적으로 생성할 수 없습니다.