오디오 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

오디오

Amazon Bedrock Data Automation(BDA) 기능은 오디오 파일을 처리하고 인사이트를 생성하기 위한 표준 출력 세트를 제공합니다. 각 작업 유형에 대한 자세한 내용은 다음과 같습니다.

전체 오디오 요약

전체 오디오 요약은 전체 오디오 파일의 전체 요약을 생성합니다. 오디오 전체에 표시되는 주요 테마, 이벤트 및 정보를 간결한 요약으로 추출합니다.

전체 오디오 트랜스크립트

전체 오디오 트랜스크립트 기능은 오디오의 모든 음성 콘텐츠를 완벽하게 텍스트로 표현합니다. 고급 음성 인식 기술을 사용하여 대화, 내레이션 및 기타 오디오 요소를 정확하게 트랜스크립션합니다. 트랜스크립션에는 타임스탬프가 포함되어 있으므로 음성 단어를 기반으로 오디오 콘텐츠를 쉽게 탐색하고 검색할 수 있습니다.

주제 요약

오디오 주제 요약은 오디오 파일을 주제라는 섹션으로 구분하고 요약하여 주요 정보를 제공합니다. 이러한 주제에는 오디오 파일 전체에 배치하는 데 도움이 되는 타임스탬프가 제공됩니다. 이 기능은 기본적으로 활성화되어 있지 않습니다.

콘텐츠 조정

콘텐츠 조절은 오디오 및 텍스트 기반 신호를 사용하여 음성 기반 유해 콘텐츠를 식별하고 7가지 범주로 분류합니다.

  • 욕설: 무례하거나 저속하거나 불쾌감을 주는 단어, 문구 또는 두문자어가 포함된 말.

  • 혐오 표현: 정체성(예: 인종, 민족, 성별, 종교, 성적 취향, 능력, 출신 국가)을 근거로 개인이나 집단을 비판, 모욕, 비인간화하는 말.

  • 성적 표현: 신체 부위, 신체적 특징 또는 성별을 직간접적으로 언급하여 성적 관심, 활동 또는 흥분을 나타내는 말.

  • 모욕: 비하하거나, 굴욕하거나, 조롱하거나, 모욕하거나, 얕보는 표현이 포함된 말. 이러한 유형의 언어는 따돌림으로도 레이블이 지정됩니다.

  • 폭력 또는 위협: 개인이나 집단에 대해 고통, 부상 또는 적대감을 주려는 위협이 포함된 말.

  • 노골적인 표현: 시각적으로 묘사적이고 불쾌할 정도로 생생한 이미지를 사용하는 말. 이러한 유형의 표현은 상대방의 불편함을 증폭시키기 위해 일부러 장황하게 말하는 경우가 많습니다.

  • 괴롭힘(harassment) 또는 학대: 상대방을 비하하고 객관화하는 표현을 포함하여 상대방의 심리적 안녕에 영향을 미치려는 의도를 가진 말. 이러한 유형의 표현은 괴롭힘(harassment)으로도 분류됩니다.

오디오 표준 출력

이 섹션에서는 오디오 파일에서 API 작업 InvokeDataAutomation을 실행하여 수신하는 다양한 응답 객체에 중점을 둡니다. 아래에서는 응답 객체의 각 섹션을 분류한 다음 예제 문서에 대해 채워진 전체 응답을 확인합니다. 받게 될 첫 번째 섹션은 입니다metadata.

{ "metadata": { "asset_id": "0", "semantic_modality": "AUDIO", "s3_bucket": "bedrock-data-automation-gamma-assets-us-east-1", "s3_key": "demo-assets/Audio/AWS_TCA-Call-Recording-2.wav", "sample_rate": 8000, "bitrate": 256000, "number_of_channels": 2, "codec": "pcm_s16le", "duration_millis": 237560, "format": "wav" },

이 섹션에서는 s3 위치, 비트 전송률, 오디오 채널 및 형식과 같은 파일에 대한 정보를 분류합니다. 다음으로를 살펴보겠습니다audio_items.

"audio_items": [ { "item_index": 0, "audio_segment_index": 0, "content": "Auto", "start_timestamp_millis": 9, "end_timestamp_millis": 119 },

항목 섹션에는 사운드별로 오디오 파일을 분석하는 작업이 포함되어 있습니다. 각 항목은 일반적으로 단어 길이에 관한 것입니다. item_index는 audio_items 표시의 항목 위치를 나타내고, audio_segment_index는 다음에 논의할 세그먼트 표시의 위치를 나타냅니다.

"audio_segments": [ { "start_timestamp_millis": 0, "end_timestamp_millis": 1970, "segment_index": 0, "type": "TRANSCRIPT", "text": "Auto sales, Cherry speaking. How can I help you?", "audio_item_indices": [ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 ] },

여기서는 더 긴 시간을 기준으로 파일을 분석합니다. 각 세그먼트는 대략 문장과 같습니다. 세그먼트에 포함되는 오디오 항목과 세그먼트 자체의 텍스트를 알려줍니다. 다음으로 콘텐츠 조정을 살펴보겠습니다.

"content_moderation": [ { "id": "93068e72-290d-4aad-8717-a2cd0e02b0d0", "type": "AUDIO_MODERATION", "confidence": 0.0476, "start_timestamp_millis": 0, "end_timestamp_millis": 1970, "moderation_categories": [ { "category": "profanity", "confidence": 0.1582 },

콘텐츠 조절 섹션은 각 개별 세그먼트를 살펴보고 7가지 조절 범주 중 하나에 대해 분석하여 각 섹션에 대한 신뢰도 점수를 제공합니다. 다음 섹션은 주제입니다.

"topics": [ { "topic_index": 0, "start_timestamp_millis": 0, "end_timestamp_millis": 36790, "summary": "As follows:\n\nSuzanne, a customer, recently had her Hyundai serviced at the auto sales shop where Carrie works. Suzanne had a 3 p.m. appointment and got her car serviced, which included an oil change and filter changes. However, when Suzanne left the shop, her oil light was still on, which she found concerning. Carrie acknowledged that this sometimes happens, even after a service visit, and assured Suzanne that she would look into the issue further.", "transcript": { "representation": { "text": "Auto sales, Cherry speaking. How can I help you? Yeah, hi Carrie, um, my name is Suzanne. I literally just left your shop. Um, I just went in and got my Hyundai service. Um, it just was, it just needed like filter error changes oil change and all that kind of stuff, um, but. When I left and my oil light is still on and I don't know why. Got it. You just got it serviced here, but when you drove off the light was still on. Is that what happened? Yeah, yeah, yeah, like I literally like I had a 3 p.m. appointment and I just got it, you know, believe it or not, this, this happens." } }, "audio_segment_indices": [ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ] },

주제 섹션은 세그먼트의 다음 수준의 세분화입니다. 이는 대략 개념별로 세분화된 세그먼트 그룹입니다. 각 주제는 주제에 대해 생성된 요약과 주제에 대한 정확한 테스트와 함께 제공됩니다. 응답의 마지막 부분은 통계입니다.

"statistics": { "word_count": 749, "topic_count": 4 }

이 섹션에서는 오디오 파일에 대한 정보를 요약합니다. 여기에는 단어 수와 총 주제가 포함됩니다.