机器学习测量值 - AWS Glue

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

机器学习测量值

要了解用于优化机器学习转换的测量值,您应熟悉以下术语:

真阳性 (TP)

转换正确找到的数据中的匹配项有时称作命中

真阴性 (TN)

转换正确拒绝的数据中的不匹配项。

假阳性 (FP)

转换错误地分类为匹配项的数据中的不匹配项有时称作假警报

假阴性 (FN)

转换未找到的数据中的匹配项有时称作未命中

有关机器学习中使用的术语的更多信息,请参阅 Wikipedia 中的 混淆矩阵

要优化您的机器学习转换,您可以在转换的 Advanced properties (高级属性) 中更改以下测量值。

  • Precision (查准率) 衡量转换在其标识为阳性的记录总数(真阳性和假阳性)中找到真阳性的程度。有关更多信息,请参阅 Wikipedia 中的查准率和查全率

  • Recall (查全率) 衡量转换从源数据中的全部记录中找到真阳性的程度。有关更多信息,请参阅 Wikipedia 中的查准率和查全率

  • Accuracy (准确性) 衡量转换发现真阳性和真阴性的程度。提高准确性需要更多的机器资源和成本。但这也会导致查全率提高。有关更多信息,请参阅 Wikipedia 中的准确性和查准率

  • Cost (成本) 衡量运行转换所消耗的计算资源(从而产生资金)的数量。