Fitur yang didukung Prasyarat Konfigurasi koneksi

Connect to Confluence untuk basis pengetahuan Amazon Bedrock Anda

Atlassian Confluence adalah alat manajemen kerja kolaboratif yang dirancang untuk berbagi, menyimpan, dan mengerjakan perencanaan proyek, pengembangan perangkat lunak, dan manajemen produk. Anda dapat terhubung ke instans Confluence untuk basis pengetahuan Amazon Bedrock Anda dengan menggunakan AWS Management Console untuk Amazon Bedrock atau (CreateDataSourceAPIlihat Amazon Bedrock didukung dan). SDKs AWS CLI

catatan

Konektor sumber data pertemuan dalam rilis pratinjau dan dapat berubah sewaktu-waktu.

Sumber data pertemuan tidak mendukung data multimodal, seperti tabel, bagan, diagram, atau gambar lainnya.

Amazon Bedrock mendukung koneksi ke instans Confluence Cloud. Saat ini, hanya penyimpanan vektor Amazon OpenSearch Tanpa Server yang tersedia untuk digunakan dengan sumber data ini.

Ada batasan berapa banyak file dan MB per file yang dapat dirayapi. Lihat Kuota untuk basis pengetahuan.

Fitur yang didukung

Deteksi otomatis bidang dokumen utama
Filter konten inklusi/pengecualian
Konten tambahan disinkronkan untuk konten yang ditambahkan, diperbarui, dihapus
OAuth2.0 otentikasi, otentikasi dengan token Confluence API

Prasyarat

Di Confluence, pastikan Anda:

Catat contoh Confluence Anda. URL Misalnya, untuk Confluence Cloud,. https://example.atlassian.net The URL for Confluence Cloud harus menjadi basisURL, diakhiri dengan. .atlassian.net
Konfigurasikan kredensional otentikasi dasar yang berisi nama pengguna (email akun admin) dan kata sandi (token ConfluenceAPI) untuk memungkinkan Amazon Bedrock terhubung ke instans Confluence Cloud Anda. Untuk informasi tentang cara membuat token Confluence, lihat Mengelola API API token untuk akun Atlassian Anda di situs web Atlassian.
(Opsional) Konfigurasikan aplikasi OAuth 2.0 dengan kredensyal kunci aplikasi, rahasia aplikasi, token akses, dan token penyegaran. Untuk informasi selengkapnya, lihat OAuth2.0 aplikasi di situs web Atlassian.
Izin baca atau cakupan tertentu harus diaktifkan agar aplikasi OAuth 2.0 Anda dapat terhubung ke Confluence.

PertemuanAPI:
- offline_access
- read:content:confluence — Lihat isi rinci
- baca:content-details:confluence - Lihat rincian konten
- baca:space-details:confluence — Lihat detail ruang
- read:audit-log:confluence - Lihat catatan audit
- baca:page:confluence - Lihat halaman
- baca: lampiran: pertemuan - Lihat dan unduh lampiran konten
- baca:blogpost:confluence - Lihat blogposts
- baca: custom-content:confluence - Lihat konten kustom
- baca:comment:confluence — Lihat komentar
- baca:template:confluence - Lihat template konten
- read:label:confluence - Lihat label
- read:watcher:confluence - Lihat pengamat konten
- read:relation:confluence - Lihat hubungan entitas
- read:user:confluence — Lihat detail pengguna
- read:configuration:confluence - Lihat pengaturan Confluence
- read:space:confluence — Lihat detail ruang
- read:space.property:confluence - Lihat properti ruang
- read:user.property:confluence - Lihat properti pengguna
- read:space.setting:confluence - Lihat pengaturan ruang
- read:analytics.content:confluence - Lihat analitik untuk konten
- read:content.property:confluence - Lihat properti konten
- read:content.metadata:confluence — Lihat ringkasan konten
- read:inlinetask:confluence - Lihat tugas
- baca:task:confluence - Lihat tugas
- baca:whiteboard:confluence — Lihat papan tulis
- baca:app-data:confluence - Baca data aplikasi
- read:folder:confluence - Lihat folder
- read:embed:confluence - Lihat data Smart Link

Di AWS akun Anda, pastikan Anda:

Simpan kredensyal otentikasi Anda secara AWS Secrets Manager rahasia dan catat Amazon Resource Name (ARN) dari rahasianya. Ikuti petunjuk konfigurasi Koneksi di halaman ini untuk menyertakan pasangan nilai kunci yang harus disertakan dalam rahasia Anda.
Sertakan izin yang diperlukan untuk terhubung ke sumber data Anda dalam kebijakan peran/izin AWS Identity and Access Management (IAM) untuk basis pengetahuan Anda. Untuk informasi tentang izin yang diperlukan untuk sumber data ini untuk ditambahkan ke IAM peran basis pengetahuan Anda, lihat Izin untuk mengakses sumber data.

catatan

Jika Anda menggunakan konsol, Anda dapat pergi ke AWS Secrets Manager untuk menambahkan rahasia Anda atau menggunakan rahasia yang ada sebagai bagian dari langkah konfigurasi sumber data. IAM Peran dengan semua izin yang diperlukan dapat dibuat untuk Anda sebagai bagian dari langkah konsol untuk membuat basis pengetahuan. Setelah Anda mengonfigurasi sumber data dan konfigurasi lainnya, IAM peran dengan semua izin yang diperlukan diterapkan ke basis pengetahuan khusus Anda.

Kami menyarankan Anda secara teratur menyegarkan atau memutar kredensyal dan rahasia Anda. Berikan hanya tingkat akses yang diperlukan untuk keamanan Anda sendiri. Kami tidak menyarankan Anda menggunakan kembali kredensyal dan rahasia di seluruh sumber data.

Konfigurasi koneksi

Untuk menyambung ke instans Confluence, Anda harus memberikan informasi konfigurasi yang diperlukan agar Amazon Bedrock dapat mengakses dan meng-crawl data Anda. Anda juga harus mengikutiPrasyarat.

Contoh konfigurasi untuk sumber data ini disertakan dalam bagian ini.

Untuk informasi selengkapnya tentang deteksi otomatis bidang dokumen, filter inklusi/pengecualian, sinkronisasi inkremental, kredensi otentikasi rahasia, dan cara kerjanya, pilih yang berikut ini:

Konektor sumber data secara otomatis mendeteksi dan merayapi semua bidang metadata utama dokumen atau konten Anda. Misalnya, konektor sumber data dapat merayapi badan dokumen yang setara dengan dokumen Anda, judul dokumen, tanggal pembuatan atau modifikasi dokumen, atau bidang inti lainnya yang mungkin berlaku untuk dokumen Anda.

penting

Jika konten Anda menyertakan informasi sensitif, maka Amazon Bedrock dapat merespons menggunakan informasi sensitif.

Anda dapat menerapkan operator pemfilteran ke bidang metadata untuk membantu Anda lebih meningkatkan relevansi tanggapan. Misalnya, dokumentasikan “epoch_modification_time” atau jumlah detik yang berlalu 1 Januari 1970 untuk saat dokumen terakhir diperbarui. Anda dapat memfilter data terbaru, di mana “epoch_modification_time” lebih besar dari angka tertentu. Untuk informasi selengkapnya tentang operator pemfilteran yang dapat Anda terapkan ke bidang metadata, lihat Metadata dan pemfilteran.

Anda dapat menyertakan atau mengecualikan perayapan konten tertentu. Misalnya, Anda dapat menentukan pola prefix/regular expression pattern to skip crawling any file that contains “private” in the file name. You could also specify an inclusion prefix/regular ekspresi pengecualian untuk menyertakan entitas konten atau jenis konten tertentu. Jika Anda menentukan filter penyertaan dan pengecualian dan keduanya cocok dengan dokumen, filter pengecualian akan diutamakan dan dokumen tidak dirayapi.

Contoh pola ekspresi reguler untuk mengecualikan atau memfilter PDF file yang berisi “pribadi” dalam nama file:”. *pribadi.*\\ .pdf”

Anda dapat menerapkan filter inklusi/pengecualian pada jenis konten berikut:

Space: Kunci spasi unik
Page: Judul halaman utama
Blog: Judul blog utama
Comment: Komentar yang termasuk dalam halaman atau blog tertentu. Tentukan Re: Page/Blog Title
Attachment: Nama file lampiran dengan ekstensinya

Konektor sumber data merayapi konten baru, dimodifikasi, dan dihapus setiap kali sumber data Anda disinkronkan dengan basis pengetahuan Anda. Amazon Bedrock dapat menggunakan mekanisme sumber data Anda untuk melacak perubahan konten dan merayapi konten yang berubah sejak sinkronisasi terakhir. Saat Anda menyinkronkan sumber data dengan basis pengetahuan untuk pertama kalinya, semua konten dirayapi secara default.

Untuk menyinkronkan sumber data Anda dengan basis pengetahuan Anda, gunakan StartIngestionJobAPIatau pilih basis pengetahuan Anda di konsol dan pilih Sinkronkan dalam bagian ikhtisar sumber data.

penting

Semua data yang Anda sinkronkan dari sumber data Anda akan tersedia bagi siapa saja yang memiliki bedrock:Retrieve izin untuk mengambil data. Ini juga dapat mencakup data apa pun dengan izin sumber data terkontrol. Untuk informasi selengkapnya, lihat Izin basis pengetahuan.

(Jika menggunakan otentikasi dasar) Kredensyal otentikasi rahasia Anda AWS Secrets Manager harus menyertakan pasangan nilai kunci ini:

username: admin user email address of Atlassian account
password: Confluence API token

(Jika menggunakan otentikasi OAuth 2.0) Kredensyal otentikasi rahasia Anda AWS Secrets Manager harus menyertakan pasangan nilai kunci ini:

confluenceAppKey: app key
confluenceAppSecret: app secret
confluenceAccessToken: app access token
confluenceRefreshToken: app refresh token

catatan

Token akses Confluence OAuth2 .0 memiliki waktu kedaluwarsa default 60 menit. Jika token ini kedaluwarsa saat sumber data Anda disinkronkan (pekerjaan sinkronisasi), Amazon Bedrock akan menggunakan token penyegaran yang disediakan untuk membuat ulang token ini. Regenerasi ini menyegarkan token akses dan penyegaran. Untuk menjaga token diperbarui dari pekerjaan sinkronisasi saat ini ke pekerjaan sinkronisasi berikutnya, Amazon Bedrock memerlukan izin menulis/menempatkan untuk kredensil rahasia Anda sebagai bagian dari peran basis pengetahuan Anda. IAM

catatan

Rahasia Anda AWS Secrets Manager harus menggunakan wilayah yang sama dari basis pengetahuan Anda.

Console

Hubungkan instans Confluence ke basis pengetahuan Anda

Ikuti langkah-langkah di Buat basis pengetahuan di Amazon Bedrock Knowledge Bases dan pilih Confluence sebagai sumber data.
Berikan nama dan deskripsi opsional untuk sumber data.
Berikan contoh Confluence Anda. URL Misalnya, untuk Confluence Cloud,. https://example.atlassian.net The URL for Confluence Cloud harus menjadi basisURL, diakhiri dengan. .atlassian.net
Di bagian Pengaturan lanjutan, Anda dapat secara opsional mengonfigurasi yang berikut:
- KMSkunci untuk penyimpanan data sementara. — Anda dapat mengenkripsi data sementara sambil mengubah data Anda menjadi embeddings dengan default atau kunci Anda sendiri. Kunci yang dikelola AWS KMS Untuk informasi selengkapnya, lihat Enkripsi penyimpanan data sementara selama konsumsi data.
- Kebijakan penghapusan data — Anda dapat menghapus embeddings vektor untuk sumber data Anda yang disimpan di penyimpanan vektor secara default, atau memilih untuk menyimpan data penyimpanan vektor.
Berikan informasi otentikasi untuk terhubung ke instans Confluence Anda:
- Untuk otentikasi dasar, buka AWS Secrets Manager untuk menambahkan kredensi otentikasi rahasia Anda atau gunakan Amazon Resource Name (ARN) yang ada untuk rahasia yang Anda buat. Rahasia Anda harus berisi alamat email pengguna admin dari akun Atlassian sebagai nama pengguna dan API token Confluence sebagai pengganti kata sandi. Untuk informasi tentang cara membuat token Confluence, lihat Mengelola API API token untuk akun Atlassian Anda di situs web Atlassian.
- Untuk otentikasi OAuth 2.0, buka AWS Secrets Manager untuk menambahkan kredensi otentikasi rahasia Anda atau gunakan Amazon Resource Name (ARN) yang ada untuk rahasia yang Anda buat. Rahasia Anda harus berisi kunci aplikasi Confluence, rahasia aplikasi, token akses, dan token penyegaran. Untuk informasi selengkapnya, lihat OAuth2.0 aplikasi di situs web Atlassian.
(Opsional) Di bagian Parsing dan chunking konten, Anda dapat menyesuaikan cara mengurai dan memotong data Anda. Lihat sumber daya berikut untuk mempelajari lebih lanjut tentang penyesuaian ini:
- Untuk informasi selengkapnya tentang opsi penguraian, lihatOpsi penguraian untuk sumber data Anda.
- Untuk informasi lebih lanjut tentang strategi chunking, lihat. Bagaimana content chunking bekerja untuk basis pengetahuan
  
  Awas
  Anda tidak dapat mengubah strategi chunking setelah terhubung ke sumber data.
- Untuk informasi selengkapnya tentang cara menyesuaikan potongan data dan pemrosesan metadata Anda dengan fungsi Lambda, lihat. Gunakan fungsi Lambda transformasi kustom untuk menentukan bagaimana data Anda dicerna
Pilih untuk menggunakan filter/pola ekspresi reguler untuk menyertakan atau mengecualikan konten tertentu. Semua konten standar dirayapi sebaliknya.
Lanjutkan untuk memilih model embeddings dan penyimpanan vektor. Untuk melihat langkah-langkah yang tersisa, kembali ke Buat basis pengetahuan di Amazon Bedrock Knowledge Bases dan lanjutkan dari langkah setelah menghubungkan sumber data Anda.

API

Berikut ini adalah contoh konfigurasi untuk menghubungkan ke Confluence Cloud untuk basis pengetahuan Amazon Bedrock Anda. Anda mengkonfigurasi sumber data Anda menggunakan API dengan AWS CLI atau didukungSDK, seperti Python. Setelah menelepon CreateKnowledgeBase, Anda menelepon CreateDataSourceuntuk membuat sumber data dengan informasi koneksi Anda didataSourceConfiguration.

Untuk mempelajari tentang penyesuaian yang dapat Anda terapkan pada konsumsi dengan menyertakan bidang opsionalvectorIngestionConfiguration, lihat. Sesuaikan konsumsi untuk sumber data

AWS Command Line Interface


aws bedrock create-data-source \
 --name "Confluence Cloud/SaaS connector" \
 --description "Confluence Cloud/SaaS data source connector for Amazon Bedrock to use content in Confluence" \
 --knowledge-base-id "your-knowledge-base-id" \
 --data-source-configuration file://confluence-bedrock-connector-configuration.json \
 --data-deletion-policy "DELETE" \
 --vector-ingestion-configuration '{"chunkingConfiguration":[{"chunkingStrategy":"FIXED_SIZE","fixedSizeChunkingConfiguration":[{"maxTokens":"100","overlapPercentage":"10"}]}]}'

confluence-bedrock-connector-configuration.json
{
    "confluenceConfiguration": {
        "sourceConfiguration": {
            "hostUrl": "https://example.atlassian.net",
            "hostType": "SAAS",
            "authType": "OAUTH2_CLIENT_CREDENTIALS",
            "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-Confluence"
        },
        "crawlerConfiguration": {
            "filterConfiguration": {
                "type": "PATTERN",
                "patternObjectFilter": {
                    "filters": [
                        {
                            "objectType": "Attachment",
                            "inclusionFilters": [
                                ".*\\.pdf"
                            ],
                            "exclusionFilters": [
                                ".*private.*\\.pdf"
                            ]
                        }
                    ]
                }
            }
        }
    },
    "type": "CONFLUENCE"
}

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Amazon S3

Microsoft SharePoint