什么是 Amazon Textract? - Amazon Textract

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

什么是 Amazon Textract?

Amazon Textract 让您可以向应用程序轻松添加文档文本检测和分析功能。使用 Amazon Textract 买家可以:

  • 检测各种文档中的打字和手写文本,包括财务报告、医疗记录和税务表格。

  • 使用 Amazon Textract 文档分析 API 从包含结构化数据的文档中提取文本、表单和表格。

  • 使用分析费用 API 处理发票和收据。

  • 使用 AnalyZeID API 处理美国政府颁发的驾驶执照和护照等身份证件。

Amazon Textract 基于同样由 Amazon 计算机视觉科学家开发的成熟且高度可扩展的深度学习技术,每天能够分析数十亿图像和视频。使用无需任何机器学习方面的专业技能。Amazon Textract 包括简单易用的 API,可以分析图像文件和 PDF 文件。Amazon Textract 始终从新数据进行学习,Amazon 会不断向此服务添加新功能。

以下是使用 Amazon Textract 的常见使用案例:

  • 创建智能搜索索引— 使用 Amazon Textract,您可以创建图像和 PDF 文件中检测到的文本库。

  • 使用智能文本提取功能进行自然语言处理 (NLP)— Amazon Textract 让您可以控制如何将文本分组为 NLP 应用程序的输入。它可以将文本提取为单词和行。如果启用了 Amazon Textract 文档表分析,它还会按表格单元格对文本进行分组。

  • 加快来自不同来源的数据的捕获和标准化— Amazon Textract 支持从各种文档中提取文本和表格数据,例如财务文档、研究报告和医疗笔记。借助 Amazon Textract 分析文档 API,您可以轻松快速地从文档中提取非结构化和结构化数据。

  • 自动从表单中捕获数据— Amazon Textract 允许从表单中提取结构化数据。借助 Amazon Textract Analysis API,您可以在现有业务工作流程中构建提取功能,以便通过表单提交的用户数据可以提取为可用的格式。

使用 Amazon Textract 的一些好处包括:

  • 将文档文本检测集成到应用中— Amazon Textract 通过使用简单 API 提供强大而准确的分析,来消除在应用程序中内置文本检测功能的复杂性。无需计算机视觉或深度学习方面的专业技能,即可使用 Amazon Textract 来检测文档文本。利用 Amazon Textract 文本 API,您可以轻松地将文本检测功能内置到任何 Web、移动或互联设备应用程序中。

  • 可扩展文档分析— Amazon Textract 使您能够快速分析和从数百万个文档中提取数据,从而加快决策过程。

  • 低成本-使用 Amazon Textract,您只需为分析文档付费。没有最低费用或预付费用。利用的分级定价模式,您可以免费开始使用并在您发展业务时节省更多成本。

借助同步处理,Amazon Textract 可以分析延迟至关重要的应用程序的单页文档。Amazon Textract 还提供异步操作以将支持扩展到多页文档。

新 Amazon Textract

如果这是您首次使用 Amazon Textract,建议您按顺序阅读以下内容:

  1. Amazon Textract 的工作原理-本节介绍 Amazon Textract 组件以及它们如何协同工作以提供端到端体验。

  2. Amazon Textract 入门— 在本部分中,您将设置账户并测试 Amazon Textract API。