文本分类 – TensorFlow 的工作原理 - Amazon SageMaker

文本分类 – TensorFlow 的工作原理

文本分类 – TensorFlow 算法会接受文本,并将文本归类为输出类标签之一。诸如 BERT 之类的深度学习网络在文本分类方面非常准确。还有一些在大型文本数据集上训练的深度学习网络,例如 TextNet,它有超过 1100 万的文本,大约有 11000 个类别。使用 TextNet 数据对网络进行训练后,您可以使用一个数据集对网络进行微调,将重点放在执行更具体的文本分类任务上。Amazon SageMaker 文本分类 – TensorFlow 算法支持使用 TensorFlow Hub 中提供的多种预先训练的模型进行迁移学习。

根据训练数据中的类标签的数量,文本分类层将附加到您选择的预先训练 TensorFlow 模型上。分类层由丢弃层、密集层和具有 2 范数正则化的完全连接层组成,并使用随机权重进行初始化。您可以更改丢弃层的丢弃比率以及密集层的 L2 正则化系数的超参数值。

您可以在新训练数据上,对整个网络(包括预训练模型)进行微调,也可以仅对顶层分类层进行微调。使用这种迁移学习方法就可以通过较小的数据集进行训练。