Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Amazon Bedrock Guardrails mendukung filter konten untuk membantu mendeteksi dan memfilter input pengguna berbahaya dan output yang dihasilkan model dalam bahasa alami. Filter konten didukung di seluruh kategori berikut:
Benci
Menjelaskan petunjuk masukan dan tanggapan model yang mendiskriminasi, mengkritik, menghina, mencela, atau merendahkan seseorang atau kelompok berdasarkan identitas (seperti ras, etnis, jenis kelamin, agama, orientasi seksual, kemampuan, dan asal negara).
Penghinaan
Menjelaskan petunjuk masukan dan respons model yang mencakup bahasa yang merendahkan, mempermalukan, mengejek, menghina, atau meremehkan. Jenis bahasa ini juga diberi label sebagai bullying.
Seksual
Menjelaskan petunjuk input dan respons model yang menunjukkan minat seksual, aktivitas, atau gairah menggunakan referensi langsung atau tidak langsung ke bagian tubuh, sifat fisik, atau jenis kelamin.
Kekerasan
Menjelaskan petunjuk masukan dan respons model yang mencakup pemuliaan, atau ancaman untuk menimbulkan rasa sakit fisik, luka, atau cedera terhadap seseorang, kelompok, atau benda.
Pelanggaran
Menjelaskan petunjuk masukan dan tanggapan model yang mencari atau memberikan informasi tentang terlibat dalam kegiatan kriminal, atau merugikan, menipu, atau mengambil keuntungan dari seseorang, kelompok atau institusi.
Serangan Cepat
Menjelaskan permintaan pengguna yang dimaksudkan untuk melewati kemampuan keamanan dan moderasi model pondasi untuk menghasilkan konten berbahaya (juga dikenal sebagai jailbreak), dan untuk mengabaikan dan mengganti instruksi yang ditentukan oleh pengembang (disebut sebagai injeksi cepat). Memerlukan tag input untuk digunakan agar serangan cepat diterapkan. Serangan cepatdeteksi membutuhkan tag input untuk digunakan.