什么是 Amazon Comprehend - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

什么是 Amazon Comprehend

Amazon Comprehend 使用自然语言处理 (NLP) 来提取有关文档内容的见解。它可以通过识别文档中的实体、关键短语、语言、情绪和其他常见元素生成见解。基于对文档结构的理解,使用 Amazon Comprehend 创建新产品。例如,使用 Amazon Comprehend,您可以在社交网络上传数据中搜索产品的提及,或扫描整个文档存储库以查找关键短语。

您可以使用 Amazon Comprehend 控制台或使用亚马逊 Comprehend API 访问亚马逊 Comprehend 文档分析功能。您可以对小型工作负载运行实时分析,也可以为大型文档集启动异步分析作业。您可以使用 Amazon Comprehend 提供的预训练模型,也可以训练自己的自定义模型进行分类和实体识别。

Amazon Comprehend 的所有功能都可以将 UTF-8 文本文档作为输入文件进行分析。此外,自定义实体识别可以分析图像文件、PDF 文件和 Word 文件。

根据具体功能,Amazon Comprehend 可以检查和分析多种语言的文档。有关更多信息,请参阅 Amazon Comprehend 中支持的语言。Amazon Compreh占优势的语言能力可以检查文档并确定更广泛的语言选择的主要语言。

Amazon Comprehend reh

Amazon Comprehend 使用预先训练的模型来检查和分析一个或一组文档,以收集有关该文档的见解。此模型在大量文本上持续训练,因此您无需提供训练数据。

Amazon Comprehend 收集以下类型的见解:

  • 实体— 对文档中包含的人物、地点、项目和位置的名称的引用。

  • 关键短语— 出现在文档中的短语。例如,关于篮球比赛的文档可能会返回球队的名称、场地名称和最终得分。

  • 个人身份信息 (PII)— 可以识别个人身份的个人数据,例如地址、银行账号或电话号码。

  • 语言— 文档的主要语言。

  • 情绪— 文档的主导情绪,可为积极、中性、消极或混杂。

  • 有针对性的情绪— 与文档中特定实体关联的情绪。每个实体事件的情绪可为积极、消极、中性或混杂。

  • Syntax— 文档中每个单词的语音部分。

有关更多信息,请参阅 见解

Amazon Comprehend reh

您可以根据自己的特定要求自定义 Amazon Comprehend,而无需具备构建基于机器学习的 NLP 解决方案所需的技能。Amazon Comprehend Custom 使用自动机器学习或 AutoML,使用您现有的数据代表您构建自定义 NLP 模型。

自定义分类— 创建自定义分类模型(分类器),将文档组织到您自己的类别中。

自定义实体识别— 创建自定义实体识别模型(识别器),该模型可以分析特定术语和基于名词的短语的文本。

有关更多信息,请参阅 Amazon Comprehend reh

文档聚类(主题建模)

您还可以使用 Amazon Comprehend 检查文档语料库,以便根据文档中的相似关键字对其进行组织。文档聚类(主题建模)对于将大型文档语料库组织成基于词频相似的主题或群集非常有用。有关更多信息,请参阅 主题建模

示例

以下示例说明如何在应用程序中使用 Amazon Comprehend 操作。

例 1:查找有关主题的文档

使用 Amazon Comprehend 主题建模查找有关特定主题的文档。扫描一组文档以确定讨论的主题,并查找与每个主题关联的文档。您可以指定 Amazon Comprehend 应从文档集中返回的主题数量。

例 2: 了解买家对您的产品的看法

如果贵公司发布了目录,请让 Amazon Comprehend 告诉您买家对您的商品的看法。将每位客户评论发送到DetectSentiment运营,它会告诉你买家对产品的看法是积极、消极、中立还是喜忧参半。

例 3: 了解对您的客户而言重要的事项

使用 Amazon Comprehend 主题建模来发现客户在论坛和留言板上讨论的主题,然后使用实体检测来确定他们与该主题关联的人、地点和事物。最后,使用情绪分析来确定客户对某个话题的看法。

优点

使用 Amazon Comprehend 的一些好处包括:

  • 将强大的自然语言处理功能集成到您的应用程序中— Amazon Comprehend 通过使用简单 API 提供强大而准确的自然语言处理,来消除在应用程序中内置文本分析功能的复杂性。您不需要文本分析专业知识即可利用 Amazon Comprehend 产生的见解。

  • 基于深度学习的自然语言处理— Amazon Comprehend 使用深度学习技术来准确分析文本。我们的模型不断使用跨多个领域的新数据进行训练,以提高准确性。

  • 可扩展自然语言处理— Amazon Comprehend 使您能够分析数百万份文档,从而发现其中包含的见解。

  • 将与其他 AWS 服务集成— Amazon Comprehend 旨在与其他 AWS 服务 (例如 Amazon S3) 无缝协作AWS KMS, 和AWS Lambda. 将您的文档存储在 Amazon S3 中,或者使用 Kinesis Data Firehose 分析实时数据。对该项的支持AWS Identity and Access Management(IAM) 可轻松安全地控制对 Amazon Comprehend 操作的访问。借助 IAM,您可以创建和管理 AWS 用户和组,以便向开发人员和最终用户授予适当的访问权。

  • 输出结果和卷数据加密— Amazon S3 已经允许你加密输入文档,而 Amazon Comprehend 则进一步扩展了这一点。通过使用您自己的 KMS 密钥,您不仅可以加密作业的输出结果,还可以加密附加到处理分析作业的计算实例的存储卷上的数据。结果显著增强了安全性。

  • 成本低— 借助 Amazon Comprehend,没有最低费用或前期承诺。您需要为分析的文档和训练的自定义模型付费。

Amazon Comprehend reh

运行实时或异步分析作业需要支付使用费。您需要为训练自定义模型付费,为自定义模型管理付费。对于使用自定义模型的实时请求,从启动终端节点到删除终端节点为止,您需要为终端节点付费。

有关费率和其他详细信息,请参阅http://aws.amazon.com/comprehend/pricing.

您是Amazon Comprehend

如果您是Amazon Comprehend,建议您按顺序阅读以下内容:

  1. 工作原理— 本节介绍Amazon Comprehend 概念。

  2. 设置— 在本部分中,您将创建一个 IAM 用户并设置AWS CLI.

  3. Amazon Comprehend 入门— 在本部分中,您将运行亚马逊理解(Amazon Comprehend)分析作业。

  4. 教程:使用亚马逊 Comprehend 分析来自买家评论的见解— 在本节中,您将执行情绪和实体分析并可视化结果。

  5. API 参考 — 在本节中,您将找到 Amazon Comprehend 操作的参考文档。

AWS提供了以下资源用于学习Amazon Comprehend 服务: