기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
분석 단계
PDF 파일을 처리하면 추가 처리 및 분석에 사용할 수 있는 콘텐츠를 추출할 수 있습니다. 예를 들어 일일 운영 보고서의 비용 필드를 사용하여 비용 추세를 식별하거나 비즈니스 운영에 대한 핵심 성과 지표(KPIs)를 집계하여 인사이트를 생성할 수 있습니다. 또한 추출된 콘텐츠를 데이터 레이크, 데이터 웨어하우스, 타사 데이터 또는 고객 관계 관리(CRM) 데이터를 비롯한 다른 데이터 소스와 결합하여 심층적인 비즈니스 분석을 수행할 수 있습니다.
Amazon QuickSight는 추출된 PDF 파일 데이터가 포함된 Amazon Simple Storage Service(Amazon S3) 버킷에 연결하는 서버리스 비즈니스 인텔리전스 서비스입니다. 그런 다음 비즈니스 분석가는 대시보드를 생성하여 S3 버킷의 JSON 파일에서 인사이트를 분석, 시각화 및 직접 생성할 수 있습니다. 대시보드는 S3 버킷에 연결되며 새 PDF 파일이 처리된 후 자동으로 업데이트됩니다. 또한 대시보드를 다른 사용자와 공유할 수 있으며, 사용자는 대시보드를 구독하여 모바일 디바이스에서 볼 수도 있습니다. 이에 대한 자세한 내용은 Amazon QuickSight 설명서의 Amazon S3 파일을 사용하여 데이터 세트 생성을 참조하세요. Amazon QuickSight
또한 대부분의 PDF 파일에는 양식 및 테이블 내부 또는 자유 텍스트 단락에 풍부한 텍스트 콘텐츠가 포함되어 있습니다. 텍스트 콘텐츠를 추출한 후 Amazon Amazon Comprehend Amazon Translate와 같은 자연어 처리(NLP)를 처리할 수 있는 다른 AWS 인공 지능 및 기계 학습(AI/ML) 서비스에서 풍부한 텍스트 콘텐츠를 사용할 수 있습니다. Amazon Kendra를 사용하여 PDF 파일의 대규모 데이터베이스에서 추출한 문서를 인덱싱하고 검색할 수도 있습니다.
또한 데이터 과학자와 ML 엔지니어는 Amazon SageMaker AI를 사용하여 S3 버킷 또는 Amazon DynamoDB 테이블에서 추출된 데이터에 직접 액세스한 다음 고급 ML 모델링 및 예측을 구현할 수 있습니다.
분석 단계의 모범 사례
다음 두 가지 모범 사례를 사용하여 성공적인 분석 단계를 보장할 수 있습니다.
-
매니페스트 파일을 생성하여 S3 버킷을 QuickSight의 데이터 소스로 사용합니다. 이에 대한 자세한 내용은 QuickSight 설명서의 자체 Amazon S3 데이터를 사용하여 분석 생성을 참조하세요.
-
Amazon S3에 추가된 새 데이터를 캡처하고 대시보드를 새로 고치도록 데이터 세트를 자동으로 업데이트합니다. 이에 대한 자세한 내용은 QuickSight 설명서의 일정에 따라 데이터 세트 새로 고침을 참조하세요.