거부된 주제를 차단하여 유해한 콘텐츠 삭제 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

거부된 주제를 차단하여 유해한 콘텐츠 삭제

제너레이티브 AI 애플리케이션 환경에서 바람직하지 않은 거부된 주제 세트로 가드레일을 구성할 수 있습니다. 예를 들어, 은행은 AI 어시스턴트가 투자 조언과 관련된 대화를 피하거나 암호화폐와 관련된 대화에 참여하기를 원할 수 있습니다.

거부 주제를 최대 30개까지 정의할 수 있습니다. 입력 프롬프트 및 모델 완성은 이러한 거부 주제 각각에 대해 평가됩니다. 거부된 주제 중 하나가 감지되면 가드레일의 일부로 구성된 차단된 메시지가 사용자에게 반환됩니다.

주제에 대한 몇 가지 선택적 예제 문구와 함께 주제에 대한 자연어 정의를 제공하여 거부된 주제를 정의할 수 있습니다. 정의 및 예제 문구는 입력 프롬프트 또는 모델 완성이 해당 주제에 속하는지 감지하는 데 사용됩니다.

거부된 주제는 다음 매개 변수로 정의됩니다.

  • 이름 — 주제 이름. 이름은 명사 또는 문구여야 합니다. 이름에 주제를 설명하지 마세요. 예:

    • Investment Advice

  • 정의 — 주제 내용을 요약하는 최대 200자 정의는 주제의 내용과 하위 주제를 설명해야 합니다.

    다음은 제공할 수 있는 주제 정의 예시입니다.

    Investment advice is inquiries, guidance, or recommendations about the management or allocation of funds or assets with the goal of generating returns or achieving specific financial objectives.

  • 샘플 문구 — 주제를 참조하는 최대 5개의 샘플 문구 목록입니다. 각 구문은 최대 100자까지 입력할 수 있습니다. 샘플은 어떤 콘텐츠를 필터링해야 하는지를 보여주는 프롬프트 또는 연속입니다. 예:

    • Is investing in the stocks better than bonds?

    • Should I invest in gold?

차단하려는 주제를 정의하는 모범 사례

  • 주제를 명확하고 정확한 방식으로 정의하십시오. 주제를 명확하고 모호하지 않게 정의하면 주제 탐지의 정확도를 높일 수 있습니다. 예를 들어, 암호화폐와 관련된 쿼리 또는 명령문을 탐지하는 주제를 다음과 같이 정의할 수 있습니다. Question or information associated with investing, selling, transacting, or procuring cryptocurrencies

  • 주제 정의에 예제나 지침을 포함시키지 마십시오. 예를 들어 Block all contents associated to cryptocurrency 는 지침일 뿐 주제에 대한 정의가 아닙니다. 이러한 지침을 주제 정의의 일부로 사용해서는 안 됩니다.

  • 부정적인 주제나 예외를 정의하지 마십시오. 예를 들어, All contents except medical information 또는 Contents not containing medical information 는 주제에 대한 부정적인 정의이므로 사용해서는 안 됩니다.

  • 거부된 주제를 사용하여 항목이나 단어를 캡처하지 마십시오. 예: Statement or questions containing the name of a person "X"또는 Statements with a competitor name Y. 주제 정의는 주제 또는 주제를 나타내며 가드레일은 입력 내용을 상황에 맞게 평가합니다. 주제 필터링은 개별 단어나 개체 유형을 캡처하는 데 사용해서는 안 됩니다. 대신 이러한 사용 사례에는 민감한 정보 필터를 사용하여 PII 대화에서 제거 또는 단어 필터를 사용하여 대화에서 특정 단어 및 구문 목록 제거 를 사용하는 것이 좋습니다.