분석 단계 - AWS 규범적 지침

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

분석 단계

PDF 파일을 처리하면 추가 처리 및 분석에 사용할 수 있는 콘텐츠를 추출할 수 있습니다. 예를 들어 일일 운영 보고서의 비용 필드를 사용하여 비용 추세를 식별하거나 비즈니스 운영에 대한 핵심 성과 지표 (KPI) 를 집계하여 통찰력을 얻을 수 있습니다. 또한 추출된 콘텐츠를 데이터 레이크, 데이터 웨어하우스, 타사 데이터 또는 고객 관계 관리 (CRM) 데이터를 비롯한 다른 데이터 소스와 결합하여 심층적인 비즈니스 분석을 수행할 수 있습니다.

QuickSightAmazon은 추출된 PDF 파일 데이터가 포함된 Amazon Simple Storage Service (Amazon S3) 버킷에 연결되는 서버리스 비즈니스 인텔리전스 서비스입니다. 그러면 비즈니스 분석가가 대시보드를 생성하여 S3 버킷의 JSON 파일을 분석 및 시각화하고 인사이트를 직접 생성할 수 있습니다. 대시보드는 S3 버킷에 연결되며 새 PDF 파일이 처리되면 자동으로 업데이트됩니다. 또한 여러 사용자와 대시보드를 공유할 수 있으며 사용자는 대시보드를 구독하여 모바일 장치에서 볼 수도 있습니다. 이에 대한 자세한 내용은 Amazon QuickSight 설명서에서 Amazon S3 파일을 사용하여 데이터세트 생성을 참조하십시오.

대부분의 PDF 파일에는 양식 및 표 내부 또는 자유 텍스트 단락에도 리치 텍스트 콘텐츠가 포함되어 있습니다. 텍스트 콘텐츠가 추출되면 Amazon Comprehend 또는 Amazon Translate Translate와 같은 자연어 처리 (NLP) 를 처리할 수 있는 다른AWS 인공 지능 및 기계 학습 (AI/ML) 서비스에서 리치 텍스트 콘텐츠를 사용할 수 있습니다. Amazon Kendra를 사용하여 대규모 PDF 파일 데이터베이스에서 추출한 문서를 인덱싱하고 검색할 수도 있습니다.

또한 데이터 과학자와 ML 엔지니어는 SageMaker Amazon을 사용하여 S3 버킷 또는 Amazon DynamoDB 테이블에서 추출된 데이터에 직접 액세스한 다음 고급 ML 모델링 및 예측을 구현할 수 있습니다.

분석 단계의 모범 사례

다음 두 가지 모범 사례를 사용하여 성공적인 분석 단계를 보장할 수 있습니다.