コンテンツのモデレーション - Amazon Rekognition

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

コンテンツのモデレーション

Amazon Rekognition を使用して、不適切、望まない、または不快なコンテンツを検出できます。ソーシャルメディア、放送メディア、広告、電子商取引の状況で Rekognition モデレーション API を使用して、より安全なユーザーエクスペリエンスを作成し、広告主にブランド安全を保証し、ローカルおよびグローバル規制に準拠できます。

今日、多くの企業は、第三者またはユーザーが生成したコンテンツをレビューするために人間のモデレーターに完全に依存しており、他の企業はユーザーの苦情に単に反応して、攻撃的または不適切な画像、広告、動画を削除しています。しかし、人間のモデレーターだけでは十分な品質やスピードでこれらのニーズを満たすようにスケールすることはできず、ユーザーエクスペリエンスの低下、スケール達成のための高コスト、ブランドの評判の喪失につながります。Rekognition をイメージおよびビデオのモデレーションに使用することで、人間のモデレーターは、機械学習によってすでにフラグが付けられている総ボリュームの 1 - 5% のかなり小さいコンテンツセットを確認することができます。これにより、より価値ある活動に集中し、既存のコストの一部で包括的なモデレーションカバレッジを実現できます。人間の労働力をセットアップし、ヒューマンレビュータスクを実行するには、すでに Rekognition と統合されている Amazon Augmented AI を使用できます。

カスタムモデレーション機能を使用すると、モデレーション深層学習モデルの精度を高めることができます。カスタムモデレーションでは、イメージをアップロードして注釈を付けることにより、カスタムモデレーションアダプターをトレーニングします。その後、DetectModerationLabelsトレーニング済みのアダプターをオペレーションに提供して、画像でのパフォーマンスを向上させることができます。詳細については、「カスタムモデレーションによる精度の向上」を参照してください。

次の図は、コンテンツモデレーションの画像コンポーネントまたはビデオコンポーネントを使用する目的に応じた呼び出し操作の順序を示しています。

イメージとビデオのモデレーション API の使用

Amazon Rekognition Image API では、DetectModerationLabelsおよびオペレーションを使用して同期的に使用したり、非同期的に使用したりして、不適切な、望ましくない、または不快なコンテンツを検出できます。StartMediaAnalysisJobGetMediaAnalysisJobAmazon Rekognition Video API では、およびオペレーションを使用してこのようなコンテンツを非同期的に検出できます。StartContentModerationGetContentModeration

ラベルのカテゴリ

Amazon Rekognition では、3 段階の階層分類を使用して、不適切、望ましくない、または不快なコンテンツのカテゴリにラベルを付けます。分類レベル 1 (L1) の各ラベルには分類レベル 2 のラベル (L2) がいくつかあり、分類レベル 2 のラベルの中には分類レベル 3 のラベル (L3) が付いているものもあります。これにより、コンテンツを階層的に分類できます。

検出されたモデレーションラベルごとに、API TaxonomyLevel はそのラベルが属するレベル (1、2、または 3) を含むも返します。たとえば、画像には以下の分類に従ってラベルが付けられる場合があります。

L1: 親密な部分やキスの非露骨なヌード、L2: 露骨でないヌード、L3: 暗示的なヌード。

注記

L1 または L2 カテゴリを使用してコンテンツをモデレートし、L3 カテゴリはモデレートしたくない特定の概念を削除する場合にのみ使用することをおすすめします(つまり、モデレーションポリシーに基づいて不適切、望ましい、または攻撃的なコンテンツとして分類したくないコンテンツを検出するため)。

次の表は、カテゴリレベルと各レベルで指定できるラベルの関係を示しています。モデレーションラベルのリストをダウンロードするには、ここをクリックしてください

最上位カテゴリ (L1) 第 2 レベルカテゴリ (L2) 第 3 レベルカテゴリ (L3) 定義
Explicit Explicit Nudity Exposed Male Genitalia Human male genitalia, including the penis (whether erect or flaccid), the scrotum, and any discernible pubic hair. This term is applicable in contexts involving sexual activity or any visual content where male genitals are displayed either completely or partially.
Exposed Female Genitalia External parts of the female reproductive system, encompassing the vulva, vagina, and any observable pubic hair. This term is applicable in scenarios involving sexual activity or any visual content where these aspects of female anatomy are displayed either completely or partially.
Exposed Buttocks or Anus Human buttocks or anus, including instances where the buttocks are nude or when they are discernible through sheer clothing. The definition specifically applies to situations where the buttocks or anus are directly and completely visible, excluding scenarios where any form of underwear or clothing provides complete or partial coverage.
Exposed Female Nipple Human female nipples, including fully visible and partially visible aerola (area surrounding the nipples) and nipples.
Explicit Sexual Activity N/A Depiction of actual or simulated sexual acts which encompasses human sexual intercourse, oral sex, as well as male genital stimulation and female genital stimulation by other body parts and objects. The term also includes ejaculation or vaginal fluids on body parts and erotic practices or roleplaying involving bondage, discipline, dominance and submission, and sadomasochism.
Sex Toys N/A Objects or devices used for sexual stimulation or pleasure, e.g., dildo, vibrator, butt plug, beats, etc.
Non-Explicit Nudity of Intimate parts and Kissing Non-Explicit Nudity Bare Back Human posterior part where the majority of the skin is visible from the neck to the end of the spine. This term does not apply when the individual's back is partially or fully occluded.
Exposed Male Nipple Human male nipples, including partially visible nipples.
Partially Exposed Buttocks Partially exposed human buttocks. This term includes a partially visible region of the buttocks or butt cheeks due to short clothes, or partially visible top portion of the anal cleft. The term does not apply to cases where the buttocks is fully nude.
Partially Exposed Female Breast Partially exposed human female breast where one a portion of the female's breast is visible or uncovered while not revealing the entire breast. This term applies when the region of the inner breast fold is visible or when the lower breast crease is visible with nipple fully covered or occluded.
Implied Nudity An individual who is nude, either topless or bottomless, but with intimate parts such as buttocks, nipples, or genitalia covered, occluded, or not fully visible.
Obstructed Intimate Parts Obstructed Female Nipple Visual depiction of a situation in which a female's nipples is covered by opaque clothing or coverings, but their shapes are clearly visible.
Obstructed Male Genitalia Visual depiction of a situation in which a male's genitalia or penis is covered by opaque clothing or coverings, but its shape is clearly visible. This term applies when the obstructed genitalia in the image is in close-up.
Kissing on the Lips N/A Depiction of one person's lips making contact with another person's lips.
Swimwear or Underwear Female Swimwear or Underwear N/A Human clothing for female swimwear (e.g., one-piece swimsuits, bikinis, tankinis, etc.) and female underwear (e.g., bras, panties, briefs, lingerie, thongs, etc.)
Male Swimwear or Underwear N/A Human clothing for male swimwear (e.g., swim trunks, boardshorts, swim briefs, etc.) and male underwear (e.g., briefs, boxers, etc.)
Violence Weapons N/A Instruments or devices used to cause harm or damage to living beings, structures, or systems. This includes firearms (e.g., guns, rifles, machine gunes, etc.), sharp weapons (e.g., swords, knives, etc.), explosives and ammunition (e.g., missile, bombs, bullets, etc.).
Graphic Violence Weapon Violence The use of weapons to cause harm, damage, injury, or death to oneself, other individuals, or properties.
Physical Violence The act of causing harm to other individuals or property (e.g., hitting, fighting, pulling hair, etc.) or other act of violence involving crowd or multiple individuals.
Self-Harm The act of causing harm to oneself, often by cutting body parts such as arms or legs, where cuts are typically visible.
Blood & Gore Visual representation of violence on a person, a group of individuals, or animals, involving open wounds, bloodshed, and mutilated body parts.
Explosions and Blasts Depiction of a violent and destructive burst of intense flames with thick smoke or dust and smoke erupting from the ground.
Visually Disturbing Death and Emaciation Emaciated Bodies Human bodies that are extremely thin and undernourished with severe physical wasting and depletion of muscle and fat tissue.
Corpses Human corpses in the form of mutilated bodies, hanging corpses, or skeletons.
Crashes Air Crash Incidents of air vehicles, such as airplanes, helicopters, or other flying vehicles, resulting in damage, injury, or death. This term applies when parts of the air vehicles are visible.
Drugs & Tobacco Products Pills Small, solid, often round or oval-shaped tables or capsules. This term applies to pills presented as standalones, in a bottle, or a transparent packet and does not apply to a visual depiction of a person taking pills.
Drugs & Tobacco Paraphernalia & Use Smoking The act of inhaling, exhaling, and lighting up burning substances including cigarettes, cigars, e-cigarettes, hookah, or joint.
Alcohol Alcohol Use Drinking The act of drinking alcoholic beverages from bottles or glasses of alcohol or liquor.
Alcoholic Beverages N/A Close up of one or multiple bottles of alcohol or liquor, glasses or mugs with alcohol or liquor, and glasses or mugs with alcohol or liquor held by an individual. This term does not apply to an individual drinking from bottles or glasses of alcohol or liquor.
Rude Gestures Middle Finger N/A Visual depiction of a hand gesture with middle finger is extended upward while the other fingers are folded down.
Gambling N/A N/A The act of participating in games of chance for a chance to win a prize in casinos, e.g., playing cards, blackjacks, roulette, slot machines at casinos, etc.
Hate Symbols Nazi Party N/A Visual depiction of symbols, flags, or gestures associated with Nazi Party.
White Supremacy N/A Visual depiction of symbols or clothings associated with Ku Klux Klan (KKK) and images with confederate flags.
Extremist N/A Images containing extremist and terrorist group flags.

L2 カテゴリのすべてのラベルに、L3 カテゴリでサポートされているラベルがあるわけではありません。また、「製品」と「薬物・たばこの道具と用途」の下にあるL3ラベルは、すべてを網羅しているわけではありません。これらの L2 ラベルは、前述の L3 ラベル以外の概念も対象としており、その場合 API レスポンスでは L2 ラベルのみが返されます。

用途に合ったコンテンツであるかどうかはお客様が判断します。例えば、暗示的な性質のイメージは受け入れ、ヌードを含むイメージは拒否することができます。イメージをフィルタリングするには、(images) と DetectModerationLabels (videos) ModerationLabelによって返されるラベル配列を使用します。GetContentModeration

コンテンツタイプ

API はアニメやイラスト入りのコンテンツタイプも識別でき、コンテンツタイプはレスポンスの一部として返されます。

  • アニメーションコンテンツには、ビデオゲームやアニメーション (漫画、コミック、マンガ、アニメなど) が含まれます。

  • イラスト付きのコンテンツには、描画、絵画、スケッチが含まれます。

信頼度

MinConfidence 入力パラメータを指定することで、安全でないコンテンツを検出するために Amazon Rekognition によって使用される信頼度のしきい値を設定できます。検出された安全でないコンテンツの信頼度が MinConfidence よりも低い場合、そのコンテンツのラベルは返されません。

50% 未満の値を指定すると、偽陽性の結果が多数返される (つまり、再現率が高いほど、精度が低くなる) 可能性があります。MinConfidence一方、50% MinConfidence を超える値を指定すると、偽陽性の結果の数が少なくなる (つまり、再現率が低く、精度が高い) 可能性が高くなります。MinConfidence の値を指定しない場合、 Amazon Rekognition は少なくとも 50% の信頼度で検出された安全でないコンテンツのラベルを返します。

ModerationLabel 配列には、上のカテゴリのラベルと検出されたコンテンツの精度を示す推定信頼度が含まれます。最上位ラベルは、識別された第 2 レベルラベルと共に返されます。例えば、Amazon Rekognition では「明示的なヌード」を最上位のラベルの高い信頼スコアと共に返すことができます。場合によりますが、フィルタ処理のニーズにはこれで十分です。ただし、必要に応じて、第 2 レベルラベル ([Graphic Male Nudity (男性のヌードイメージ)] など) の信頼スコアを使用して、よりきめ細かなフィルタ処理が可能です。例については、不適切なイメージの検出を参照してください。

バージョニング

Amazon Rekognition イメージと Amazon Rekognition Video は、両方とも、不適切なコンテンツの検出に使用されるモデレーション検出のバージョンを返します (ModerationModelVersion)。

並び替えと集計

で結果を取得する場合 GetContentModeration、結果をソートして集計できます。

並べ替えの順序 – 返されるラベルの配列は時間を基準に並べ替えられます。ラベル別に並べ替えるには、GetContentModerationSortBy 入力パラメータに NAME を指定します。ビデオ内でラベルが複数回表示されている場合、ModerationLabel 要素のインスタンスは複数になります。

ラベル情報 — ModerationLabels 配列要素にはオブジェクトが含まれ、ModerationLabelそのオブジェクトにはラベル名と、検出されたラベルの精度に対する Amazon Rekognition の信頼度が含まれます。タイムスタンプは ModerationLabel が検出された時間を表し、ビデオの開始から経過した時間がミリ秒数として定義されます。ビデオ SEGMENTS ごとに集計された結果では、StartTimestampMillisEndTimestampMillisDurationMillis 構造が返され、それぞれセグメントの開始時間、終了時間、持続時間を定義します。

集計 — 結果が返されたときの集計方法を指定します。デフォルトでは TIMESTAMPS によって集計されます。また、SEGMENTS による集計を選択することもできます。この方法では、時間枠の結果が集計されます。このセグメント中に検出されたラベルのみが返されます。

カスタムモデレーションアダプタのステータス

カスタムモデレーションアダプターには、「TRAINING_IN_PROGRESS」、「TRAINING_COMPLETED」、「TRAINING_FAILED」、「削除中」、「廃止済み」、「期限切れ」のいずれかのステータスがあります。これらのアダプターのステータスの詳細については、「アダプターの管理」を参照してください。

注記

Amazon Rekognitionは、不適切または不快なコンテンツに関する権威ではなく、また網羅的なフィルタリングであると主張するものではありません。また、イメージおよびビデオのモデレーション API は、CSAM などの違法なコンテンツが含まれているかどうかは検出しません。