Amazon SageMaker AI - Amazon Timestream

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon SageMaker AI

Amazon SageMaker 노트북을 사용하여 기계 학습 모델을 Amazon Timestream과 통합할 수 있습니다. 시작하는 데 도움이 되도록 Timestream의 데이터를 처리하는 샘플 SageMaker Notebook을 만들었습니다. 데이터는 데이터를 지속적으로 전송하는 다중 스레드 Python 애플리케이션에서 Timestream에 삽입됩니다. 샘플 SageMaker 노트북 및 샘플 Python 애플리케이션의 소스 코드는 GitHub에서 사용할 수 있습니다.

  1. 데이터베이스 생성 및에 설명된 지침에 따라 데이터베이스와 테이블을 생성합니다테이블 생성.

  2. GitHub의 지침에 따라 다중 스레드 Python 샘플 애플리케이션의 GitHub 리포지토리를 복제합니다.

  3. GitHub의 지침에 따라 샘플 Timestream SageMaker Notebook GitHub 리포지토리를 복제합니다.

  4. README의 지침에 따라 Timestream으로 데이터를 지속적으로 수집하기 위해 애플리케이션을 실행합니다.

  5. 지침에 따라 여기에 설명된 대로 Amazon SageMaker용 Amazon S3 버킷을 생성합니다. Amazon SageMaker

  6. 최신 boto3가 설치된 Amazon SageMaker 인스턴스 생성: 여기에 설명된 지침 외에도 아래 단계를 따릅니다.

    1. 노트북 인스턴스 생성 페이지에서 추가 구성을 클릭합니다.

    2. 수명 주기 구성 - 선택 사항을 클릭하고 새 수명 주기 구성 생성을 선택합니다.

    3. 수명 주기 구성 생성 마법사 상자에서 다음을 수행합니다.

      1. 구성에 원하는 이름을 입력합니다. 예: on-start

      2. 노트북 스크립트 시작에서 Github의 스크립트 콘텐츠를 복사하여 붙여넣습니다.

      3. 붙여넣은 스크립트PACKAGE=boto3에서를 PACKAGE=scipy로 바꿉니다.

  7. 구성 생성을 클릭합니다.

  8. AWS 관리 콘솔에서 IAM 서비스로 이동하여 노트북 인스턴스에 대해 새로 생성된 SageMaker 실행 역할을 찾습니다.

  9. 에 대한 IAM 정책을 AmazonTimestreamFullAccess 실행 역할에 연결합니다.

    참고

    AmazonTimestreamFullAccess IAM 정책은 특정 리소스로 제한되지 않으며 프로덕션 용도로 적합하지 않습니다. 프로덕션 시스템의 경우 특정 리소스에 대한 액세스를 제한하는 정책을 사용하는 것이 좋습니다.

  10. 노트북 인스턴스의 상태가 InService인 경우 Jupyter 열기를 선택하여 인스턴스에 대한 SageMaker 노트북을 시작합니다.

  11. 업로드 버튼을 선택하여 노트북Timestream_SageMaker_Demo.ipynbtimestreamquery.py 및 파일을 업로드합니다.

  12. Timestream_SageMaker_Demo.ipynb

    참고

    커널을 찾을 수 없는 팝업이 표시되면 conda_python3을 선택하고 커널 설정을 클릭합니다.

  13. 훈련 모델의 데이터베이스 이름DB_NAME, 테이블 이름, S3 버킷 이름 및 리전과 ENDPOINT 일치하도록 TABLE_NAMEbucket, , ,를 수정합니다.

  14. 재생 아이콘을 선택하여 개별 셀을 실행합니다.

  15. 셀에 도달하면 출력이 최소 2개의 호스트 이름을 반환하는지 Leverage Timestream to find hosts with average CPU utilization across the fleet확인합니다.

    참고

    출력에 호스트 이름이 2개 미만인 경우 스레드와 호스트 규모가 더 많은 Timestream으로 데이터를 수집하는 샘플 Python 애플리케이션을 다시 실행해야 할 수 있습니다.

  16. 셀에 도달하면 훈련 작업에 대한 리소스 요구 사항에 train_instance_type 따라를 Train a Random Cut Forest (RCF) model using the CPU utilization history변경합니다.

  17. 셀에 도달하면 추론 작업에 대한 리소스 요구 사항에 instance_type 따라를 Deploy the model for inference변경합니다.

    참고

    모델을 훈련하는 데 몇 분 정도 걸릴 수 있습니다. 훈련이 완료되면 셀의 출력에 완료됨 - 훈련 작업 완료 메시지가 표시됩니다.

  18. 셀을 실행Stop and delete the endpoint하여 리소스를 정리합니다. SageMaker 콘솔에서 인스턴스를 중지하고 삭제할 수도 있습니다.