crowd-entity-annotation - Amazon SageMaker

crowd-entity-annotation

Widget pour étiqueter des mots, des expressions ou des chaînes de caractères dans un texte long. Les travailleurs sélectionnent une étiquette et mettent en surbrillance le texte auquel elle s'applique.

Important : Widget autonome

N'utilisez pas l'élément <crowd-entity-annotation> avec l'élément <crowd-form>. Il contient sa propre logique de soumission de formulaire et son bouton Submit (Envoyer) .

Consultez un exemple interactif d'un modèle HTML qui utilise cet élément HTML Crowd dans CodePen.

Voici un exemple de modèle d'enquête qui utilise l'élément <crowd-entity-annotation>. Copiez le code suivant et enregistrez-le dans un fichier avec l'extension .html. Ouvrez le fichier dans n'importe quel navigateur pour prévisualiser et interagir avec ce modèle.

<script src="https://assets.crowd.aws/crowd-html-elements.js"></script> <crowd-entity-annotation name="crowd-entity-annotation" header="Highlight parts of the text below" labels="[{'label': 'person', 'shortDisplayName': 'per', 'fullDisplayName': 'Person'}, {'label': 'date', 'shortDisplayName': 'dat', 'fullDisplayName': 'Date'}, {'label': 'company', 'shortDisplayName': 'com', 'fullDisplayName': 'Company'}]" text="Amazon SageMaker Ground Truth helps you build highly accurate training datasets for machine learning quickly." > <full-instructions header="Named entity recognition instructions"> <ol> <li><strong>Read</strong> the text carefully.</li> <li><strong>Highlight</strong> words, phrases, or sections of the text.</li> <li><strong>Choose</strong> the label that best matches what you have highlighted.</li> <li>To <strong>change</strong> a label, choose highlighted text and select a new label.</li> <li>To <strong>remove</strong> a label from highlighted text, choose the X next to the abbreviated label name on the highlighted text.</li> <li>You can select all of a previously highlighted text, but not a portion of it.</li> </ol> </full-instructions> <short-instructions> Apply labels to words or phrases. </short-instructions> <div id="additionalQuestions" style="margin-top: 20px"> <h3> What is the overall subject of this text? </h3> <crowd-radio-group> <crowd-radio-button name="tech" value="tech">Technology</crowd-radio-button> <crowd-radio-button name="politics" value="politics">Politics</crowd-radio-button> </crowd-radio-group> </div> </crowd-entity-annotation> <script> document.addEventListener('all-crowd-elements-ready', () => { document .querySelector('crowd-entity-annotation') .shadowRoot .querySelector('crowd-form') .form .appendChild(additionalQuestions); }); </script>

Attributes

Les attributs suivants sont pris en charge par cet élément.

header

Texte à afficher au-dessus de l'image. Il s'agit généralement d'une question ou d'une instruction simple pour l'employé.

initial-value

Tableau d'objets au format JSON, chacun d'entre eux définissant une annotation à appliquer au texte lors de l'initialisation. Les objets contiennent une valeur label qui correspond à une étiquette dans l'attribut labels, une valeur startOffset entière pour le décalage Unicode de départ de la plage étiquetée et une valeur endOffset entière pour le décalage Unicode de fin.

[ { label: 'person', startOffset: 0, endOffset: 16 }, ... ]

labels

Tableau d'objets au format JSON, chacun d'entre eux contenant :

  • label (obligatoire) : Nom utilisé pour identifier les entités.

  • fullDisplayName (facultatif) : Utilisé pour la liste d'étiquettes dans le widget de tâche. La valeur d'étiquette n'est pas spécifiée par défaut.

  • shortDisplayName (facultatif) : Abréviation de 3 à 4 lettres à afficher au-dessus des entités sélectionnées. La valeur d'étiquette n'est pas spécifiée par défaut.

    shortDisplayName est fortement recommandé

    Les valeurs affichées au-dessus des sélections peuvent se chevaucher et engendrer des difficultés à gérer les entités étiquetées dans l'espace de travail. Il est vivement recommandé de fournir un shortDisplayName de 3 à 4 caractères pour chaque étiquette afin d'éviter les chevauchements et de maintenir l'espace de travail gérable pour vos employés.

[ { label: 'person', shortDisplayName: 'per', fullDisplayName: 'person' } ]

nom

Sert de nom du widget dans le DOM. Il est également utilisé comme nom d'attribut d'étiquette dans la sortie du formulaire et le manifeste de sortie.

text

Texte à annoter. Le système de modélisation place les guillemets et les chaînes HTML dans une séquence d'échappement par défaut. Si votre code est déjà placé dans une séquence d'échappement ou l'est partiellement, consultez Filtres de variables pour obtenir d'autres façons de contrôler l'échappement.

Hiérarchie des éléments

Les éléments parents et enfants de cet élément sont les suivants :

Régions

Les régions suivantes sont prises en charge par cet élément.

full-instructions

Instructions générales sur la façon d'utiliser le widget.

short-instructions

Instructions importantes spécifiques à la tâche qui s'affichent à un endroit bien visible.

Sortie

La sortie suivante est prise en charge par cet élément.

entities

Objet JSON qui spécifie le début, la fin et l'étiquette d'une annotation. Cet objet contient les propriétés suivantes.

  • label : étiquette attribuée.

  • startOffset : décalage Unicode du début du texte sélectionné.

  • endOffset : décalage Unicode du premier caractère après la sélection.

Exemple : Exemples de sorties de l'élément

L'exemple suivant est la sortie de cet élément.

{ "myAnnotatedResult": { "entities": [ { "endOffset": 54, "label": "person", "startOffset": 47 }, { "endOffset": 97, "label": "event", "startOffset": 93 }, { "endOffset": 219, "label": "date", "startOffset": 212 }, { "endOffset": 271, "label": "location", "startOffset": 260 } ] } }

Voir aussi

Pour plus d’informations, consultez les rubriques suivantes.