有针对性的情绪 - Amazon Comprehend

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

有针对性的情绪

有针对性的情绪提供对输入文档中与特定实体(如品牌或产品)相关的情绪的精细理解。

有针对性的情绪与之间的区别情绪是输出数据中的粒度级别。情绪分析确定每个输入文档的主导情绪,但不提供数据供进一步分析。目标情绪分析可确定每个输入文档中特定实体的实体级情绪。您可以分析输出数据,以确定获得正面或负面反馈的特定产品和服务。

例如,在一组餐厅评论中,一位顾客提供了以下评论:“炸玉米饼很好吃,工作人员也很友好。” 对该评论的分析可得出以下结果:

  • 情绪分析可确定每家餐厅评价的整体情绪是积极、消极、中性还是混杂。在这个例子中,总体情绪是积极的。

  • 有针对性的情绪分析决定顾客在评论中提及的餐厅实体和属性的情绪。在此示例中,客户对 “tacos” 和 “员工” 给予了正面评价)。

目标情绪为每个分析作业提供以下输出:

  • 文件中提及的实体的身份。

  • 每个实体提及的实体类型的分类。

  • 每个实体提及的情绪和情绪得分。

  • 对应于单个实体的提及组(共同引用组)。

您可以使用控制台或者API运行有针对性的情绪分析。要运行目标情绪,您需要启动异步分析作业;目标情绪无法进行实时分析。

Amazon Comprehend 支持针对英语文档的有针对性的情绪。

有关目标情绪的更多信息(包括教程),请参阅使用Amazon Comprehend 目标情绪提取文本中的精细情绪.

实体类型

目标情绪标识以下实体类型。如果实体不属于任何其他类别,则它会分配实体类型 OTHER。输出文件中提及的每个实体都包含实体类型,例如"Type": "PERSON".

实体类型定义
实体类型 定义
例子包括个人、人群、昵称、虚构人物和动物名字。
LOCATION 地理位置,例如国家、城市、州、地址、地质构造、水体、自然地标和天文位置。
组织 例子包括政府、公司、运动队和宗教。
设施 建筑、机场、高速公路、桥梁和其他永久性人造结构和房地产改善。
品牌 特定商业项目或产品系列的组织、团体或生产商。
COMMERCIAL_IT 任何非通用可购买或可购买的物品,包括车辆和仅生产一件商品的大型商品。
电影 电影或电视节目。实体可以是全名、昵称或副标题。
音乐 一首歌曲,全部或部分歌曲。此外,还有个人音乐创作的集合,例如专辑或选集。
预订 专业出版或自行出版的书籍。
软件 正式发布的软件产品。
比赛 游戏,例如视频游戏、棋盘游戏、普通游戏或体育游戏。
个人头衔 官方头衔和荣誉,例如总统, 博士, 或博士.
EVENT 例子包括节日、音乐会、选举、战争、会议和促销活动。
DATE 对日期或时间的任何引用,无论是具体的还是一般的,无论是绝对的还是相对的。
数量 所有测量值及其单位(货币、百分比、数字、字节等)。
ATTRIBUTE 实体的属性、特征或特征,例如产品的 “质量”、电话的 “价格” 或 CPU 的 “速度”。
OTHER 不属于任何其他类别的实体。

共有者

目标情绪标识每个输入文档中的共同参考组。共同参考组是文档中与一个真实世界实体相对应的一组提及。

在以下客户评论示例中,“spa” 是具有实体类型的实体FACILITY. 该实体还有两个额外的提及作为代词(“it”)。

I enjoyed visiting the spa. It was very comfortable. But it was also expensive.

Oput file

目标情绪分析作业将创建 JSON 文本输出文件。该文件包含每个输入文档的一个 JSON 对象。每个 JSON 对象包含以下字段:

  • 实体— 在文档中找到的实体数组。

  • File (文件)— 输入文档的文件名。

  • Line— 如果输入文件是每行一个文档,实体包含文件中文档的行号。

下面的示例显示实体用于包含三行输入的输入文件。输入格式为ONE_DOC_PER_LINE,因此每行输入都是一个文档。

{ "Entities":[ {entityA}, {entityB}, {entityC} ], "File": "TargetSentimentInputDocs.txt", "Line": 0 } { "Entities": [ {entityD}, {entityE} ], "File": "TargetSentimentInputDocs.txt", "Line": 1 } { "Entities": [ {entityF}, {entityG} ], "File": "TargetSentimentInputDocs.txt", "Line": 2 }

中的一个实体实体数组包括文档中检测到的实体提及的逻辑分组(称为共同引用组)。每个实体都有以下总体结构:

{"DescriptiveMentionIndex": [0], "Mentions": [ {mentionD}, {mentionE} ] }

实体包含以下字段:

  • 提及— 在文档中提及该实体的数组。该数组表示一个共同引用组。有关示例,请参阅共有者。提及数组中的提及顺序是指它们在文档中的位置(偏移量)顺序。每个提及都包括该提及的情绪得分和小组得分。组分数表示这些提及属于同一实体的可信度。

  • DescriptiveMentionIndex— Mentions 数组中的一个或多个索引,该索引为实体组提供最佳名称。例如,一个实体可能有三次提及Text重视 “ABC 酒店”、“ABC 酒店” 和 “it”。最好的名字是 “ABC Hotel”,它有一个 DescriptiveMentionIndex 值 [0,1]。

每个提及包含以下字段

  • BeginOffset— 文档文本中提及的起始位置的偏移量。

  • EndOffset— 文档文本中提及的结束位置的偏移量。

  • GroupScore— 组中提到的所有实体都与同一个实体相关的信心。

  • Text— 文档中标识实体的文本。

  • 类型— 实体的类型。亚马逊 Comprehend 支持各种实体类型.

  • 得分— 对实体相关性的置信度建模。值范围为 0 到 1,其中 1 表示最高置信度。

  • MentionSentiment— 包含提及的情绪和情绪得分。

  • 情绪— 提及的情绪。值包括:正面、中性、负面和混合。

  • SentimentScore— 为每种可能的情绪提供模型信心。值范围为 0 到 1,其中 1 表示最高置信度。

这些区域有:情绪value 有以下含义:

  • 积极— 实体提及表达了积极的情绪。

  • Nope— 实体提及表达负面情绪。

  • 混杂— 实体提及表达正面和负面情绪。

  • Neutral— 实体提及不表达正面或负面情绪。

在以下示例中,一个实体在输入文档中只有一个提及,因此 DescriptiveMentionIndex为零(提及数组中的第一个提及)。标识的实体是名为 “I” 的人员 情绪分数是中性的。

{"Entities":[ { "DescriptiveMentionIndex": [0], "Mentions": [ { "BeginOffset": 0, "EndOffset": 1, "Score": 0.999997, "GroupScore": 1, "Text": "I", "Type": "PERSON", "MentionSentiment": { "Sentiment": "NEUTRAL", "SentimentScore": { "Mixed": 0, "Negative": 0, "Neutral": 1, "Positive": 0 } } } ] } ], "File": "Input.txt", "Line": 0 }

有针对性的情绪示例

下面的示例显示了来自目标情绪分析作业的Output file file。输入文件由三个简单的文档组成:

The burger was very flavorful and the burger bun was excellent. However, customer service was slow. My burger was good, and it was warm. The burger had plenty of toppings. The burger was cooked perfectly but it was cold. The service was OK.

此输入文件分析的输出文件

{"Entities":[ { "DescriptiveMentionIndex": [ 0 ], "Mentions": [ { "BeginOffset": 4, "EndOffset": 10, "Score": 0.999991, "GroupScore": 1, "Text": "burger", "Type": "OTHER", "MentionSentiment": { "Sentiment": "POSITIVE", "SentimentScore": { "Mixed": 0, "Negative": 0, "Neutral": 0, "Positive": 1 } } } ] }, { "DescriptiveMentionIndex": [ 0 ], "Mentions": [ { "BeginOffset": 38, "EndOffset": 44, "Score": 1, "GroupScore": 1, "Text": "burger", "Type": "OTHER", "MentionSentiment": { "Sentiment": "NEUTRAL", "SentimentScore": { "Mixed": 0.000005, "Negative": 0.000005, "Neutral": 0.999591, "Positive": 0.000398 } } } ] }, { "DescriptiveMentionIndex": [ 0 ], "Mentions": [ { "BeginOffset": 45, "EndOffset": 48, "Score": 0.961575, "GroupScore": 1, "Text": "bun", "Type": "OTHER", "MentionSentiment": { "Sentiment": "POSITIVE", "SentimentScore": { "Mixed": 0.000327, "Negative": 0.000286, "Neutral": 0.050269, "Positive": 0.949118 } } } ] }, { "DescriptiveMentionIndex": [ 0 ], "Mentions": [ { "BeginOffset": 73, "EndOffset": 89, "Score": 0.999988, "GroupScore": 1, "Text": "customer service", "Type": "ATTRIBUTE", "MentionSentiment": { "Sentiment": "NEGATIVE", "SentimentScore": { "Mixed": 0.000001, "Negative": 0.999976, "Neutral": 0.000017, "Positive": 0.000006 } } } ] } ], "File": "TargetSentimentInputDocs.txt", "Line": 0 } { "Entities": [ { "DescriptiveMentionIndex": [ 0 ], "Mentions": [ { "BeginOffset": 0, "EndOffset": 2, "Score": 0.99995, "GroupScore": 1, "Text": "My", "Type": "PERSON", "MentionSentiment": { "Sentiment": "NEUTRAL", "SentimentScore": { "Mixed": 0, "Negative": 0, "Neutral": 1, "Positive": 0 } } } ] }, { "DescriptiveMentionIndex": [ 0, 2 ], "Mentions": [ { "BeginOffset": 3, "EndOffset": 9, "Score": 0.999999, "GroupScore": 1, "Text": "burger", "Type": "OTHER", "MentionSentiment": { "Sentiment": "POSITIVE", "SentimentScore": { "Mixed": 0.000002, "Negative": 0.000001, "Neutral": 0.000003, "Positive": 0.999994 } } }, { "BeginOffset": 24, "EndOffset": 26, "Score": 0.999756, "GroupScore": 0.999314, "Text": "it", "Type": "OTHER", "MentionSentiment": { "Sentiment": "POSITIVE", "SentimentScore": { "Mixed": 0, "Negative": 0.000003, "Neutral": 0.000006, "Positive": 0.999991 } } }, { "BeginOffset": 41, "EndOffset": 47, "Score": 1, "GroupScore": 0.531342, "Text": "burger", "Type": "OTHER", "MentionSentiment": { "Sentiment": "POSITIVE", "SentimentScore": { "Mixed": 0.000215, "Negative": 0.000094, "Neutral": 0.00008, "Positive": 0.999611 } } } ] }, { "DescriptiveMentionIndex": [ 0 ], "Mentions": [ { "BeginOffset": 52, "EndOffset": 58, "Score": 0.965462, "GroupScore": 1, "Text": "plenty", "Type": "QUANTITY", "MentionSentiment": { "Sentiment": "NEUTRAL", "SentimentScore": { "Mixed": 0, "Negative": 0, "Neutral": 1, "Positive": 0 } } } ] }, { "DescriptiveMentionIndex": [ 0 ], "Mentions": [ { "BeginOffset": 62, "EndOffset": 70, "Score": 0.998353, "GroupScore": 1, "Text": "toppings", "Type": "OTHER", "MentionSentiment": { "Sentiment": "NEUTRAL", "SentimentScore": { "Mixed": 0, "Negative": 0, "Neutral": 0.999964, "Positive": 0.000036 } } } ] } ], "File": "TargetSentimentInputDocs.txt", "Line": 1 } { "Entities": [ { "DescriptiveMentionIndex": [ 0 ], "Mentions": [ { "BeginOffset": 4, "EndOffset": 10, "Score": 1, "GroupScore": 1, "Text": "burger", "Type": "OTHER", "MentionSentiment": { "Sentiment": "POSITIVE", "SentimentScore": { "Mixed": 0.001515, "Negative": 0.000822, "Neutral": 0.000243, "Positive": 0.99742 } } }, { "BeginOffset": 36, "EndOffset": 38, "Score": 0.999843, "GroupScore": 0.999661, "Text": "it", "Type": "OTHER", "MentionSentiment": { "Sentiment": "NEGATIVE", "SentimentScore": { "Mixed": 0, "Negative": 0.999996, "Neutral": 0.000004, "Positive": 0 } } } ] }, { "DescriptiveMentionIndex": [ 0 ], "Mentions": [ { "BeginOffset": 53, "EndOffset": 60, "Score": 1, "GroupScore": 1, "Text": "service", "Type": "ATTRIBUTE", "MentionSentiment": { "Sentiment": "NEUTRAL", "SentimentScore": { "Mixed": 0.000033, "Negative": 0.000089, "Neutral": 0.993325, "Positive": 0.006553 } } } ] } ], "File": "TargetSentimentInputDocs.txt", "Line": 2 } }