As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Fase de análise
Ao processar arquivos PDF, você extrai conteúdo que pode ser usado para processamento e análise adicionais. Por exemplo, você pode identificar tendências de custo usando os campos de custo dos relatórios de operações diárias ou gerar insights agregando indicadores-chave de desempenho (KPIs) para operações comerciais. Você também pode combinar o conteúdo extraído com outras fontes de dados, incluindo lagos de dados, data warehouses, dados de terceiros ou dados de gerenciamento de relacionamento com o cliente (CRM) para realizar análises comerciais detalhadas.
QuickSightA Amazon é um serviço de inteligência de negócios sem servidor que se conecta ao bucket do Amazon Simple Storage Service (Amazon S3) que contém os dados extraídos do arquivo PDF. Seus analistas de negócios podem então criar um painel para analisar, visualizar e gerar insights diretamente dos arquivos JSON no bucket do S3. O painel se conecta ao bucket do S3 e é atualizado automaticamente após o processamento de novos arquivos PDF. Você também pode compartilhar o painel com diferentes usuários e os usuários também podem se inscrever no painel para visualizá-lo em um dispositivo móvel. Para obter mais informações sobre isso, consulte Criação de um conjunto de dados usando arquivos do Amazon S3 na documentação da Amazon QuickSight .
A maioria dos arquivos PDF também contém conteúdo de texto rico em formulários e tabelas ou em um parágrafo de texto livre. Depois que o conteúdo do texto é extraído, o conteúdo de texto rico pode ser usado por outros serviços de inteligência AWS artificial e aprendizado de máquina (AI/ML) que podem lidar com o processamento de linguagem natural (NLP), como o Amazon Comprehend ou o Amazon Translate. Você também pode usar o Amazon Kendra para indexar e pesquisar documentos extraídos de um grande banco de dados de arquivos PDF.
Seus cientistas de dados e engenheiros de ML também podem usar o Amazon SageMaker AI para acessar diretamente os dados extraídos no bucket do S3 ou na tabela do Amazon DynamoDB e, em seguida, implementar modelagem e previsão avançadas de ML.
Melhores práticas para a fase de análise
Você pode usar as duas melhores práticas a seguir para garantir uma fase de análise bem-sucedida:
-
Crie um arquivo de manifesto para o qual usar um bucket do S3 como fonte de QuickSight dados. Para obter mais informações sobre isso, consulte Criar uma análise usando seus próprios dados do Amazon S3 na QuickSight documentação.
-
Atualize automaticamente seu conjunto de dados para capturar novos dados adicionados ao Amazon S3 e atualizar seu painel. Para obter mais informações sobre isso, consulte Atualização de um conjunto de dados em um cronograma na QuickSight documentação.