文本分类- TensorFlow 工作原理

文本分类- TensorFlow 算法将文本归类为输出类标签之一。诸如 BERT 之类的深度学习网络在文本分类方面非常准确。还有一些在大型文本数据集上训练的深度学习网络，例如 TextNet，它有超过1100万个文本，大约有11,000个类别。使用 TextNet 数据对网络进行训练后，您可以针对具有特定重点的数据集对网络进行微调，以执行更具体的文本分类任务。Amazon SageMaker AI 文本分类 TensorFlow 算法支持在 TensorFlow Hub 中提供的许多预训练模型上进行迁移学习。

根据训练数据中类别标签的数量，文本分类层将附加到您选择的预训练 TensorFlow 模型上。分类层由丢弃层、密集层和具有 2 范数正则化的完全连接层组成，并使用随机权重进行初始化。您可以更改丢弃层的丢弃比率以及密集层的 L2 正则化系数的超参数值。

您可以在新训练数据上，对整个网络（包括预训练模型）进行微调，也可以仅对顶层分类层进行微调。使用这种迁移学习方法就可以通过较小的数据集进行训练。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

文本分类- TensorFlow 算法的输入和输出接口

TensorFlow 模特