護欄的組件 - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

護欄的組件

Amazon Bdrock Guardrails 包含一系列不同的篩選政策,您可以設定這些政策以避免不受歡迎和有害的內容,並移除或遮罩敏感資訊以保護隱私權。

您可以在護欄中設定下列原則:

  • 內容過濾器 — 您可以配置閾值以阻止輸入提示或模擬包含有害內容的響應,例如仇恨,侮辱,性,暴力,不當行為(包括犯罪活動)和即時攻擊(即時注入和越獄)。例如,電子商務網站可以設計其在線助理,以避免使用不當的語言,例如仇恨言論或侮辱。

  • 拒絕的主題 — 您可以定義一組要在生成 AI 應用程式中避免的主題。例如,銀行助理應用程序可以被設計為避免與非法投資建議有關的主題。

  • 字詞篩選器 — 您可以設定一組要偵測的自訂字詞或片語,並封鎖使用者與生成式 AI 應用程式之間的互動。例如,您可以偵測並封鎖不雅用語以及特定的自訂字詞,例如競爭對手名稱或其他令人反感的字詞。

  • 敏感資訊篩選器 — 您可以偵測敏感內容,例如個人識別資訊 (PII) 或使用者輸入和 FM 回應中的自訂正則運算式實體。根據使用案例,您可以拒絕包含敏感資訊的輸入,或在 FM 回應中編輯它們。例如,您可以編輯用戶的個人信息,同時從客戶和代理商對話記錄中生成摘要。

  • 關聯式接地檢查 — 如果模型回應中的幻覺未在來源資訊中接地 (事實上不正確或新增新資訊),或與使用者的查詢無關,您可以偵測並篩選這些幻覺。例如,如果模型回應與擷取的段落中的資訊偏離或未回答使用者的問題,您可以封鎖或標記 RAG 應用程式中的回應 (擷取-增強產生)。