음성 인식 향상을 위한 사용자 지정 어휘 작성 - Amazon Lex

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

음성 인식 향상을 위한 사용자 지정 어휘 작성

Amazon Lex V2에 특정 언어로 사용자 지정 어휘를 만들어 봇과의 오디오 대화를 처리하는 방법에 대해 추가 정보를 제공할 수 있습니다. A사용자 지정 어휘는 Amazon Lex V2에서 오디오 입력에서 인식하게 하려는 특정 구절의 목록입니다. 일반적으로 Amazon Lex V2가 인식하지 못하는 적절한 명사 또는 도메인별 단어입니다.

예를 들어 기술 지원 봇이 있다고 가정해보겠습니다. 사용자 지정 어휘에 “백업”을 추가하여 오디오가 “팩 업”처럼 들리더라도 봇이 오디오를 “백업”으로 올바르게 기록할 수 있습니다. 사용자 지정 어휘는 또한 금융 서비스에 대한 “지급 능력”과 같은 오디오의 희귀 단어나 “Cognito” 또는 “Monitron”과 같은 적절한 명사를 인식하는 데 도움이 될 수 있습니다.

사용자 지정 어휘 기본

  • 사용자 지정 어휘는 봇에 오디오 입력을 기록하는 작업을 수행합니다. 의도 또는 슬롯 값을 인식하려면 샘플 발언을 제공해야 합니다.

  • 사용자 지정 어휘는 특정 언어에만 고유합니다. 각 언어에 대해 개별적으로 사용자 지정 어휘를 구성해야 합니다. 사용자 지정 어휘는 영어 (영국) 언어에서만 지원됩니다.

  • 사용자 지정 어휘는 8kHz 오디오 입력만 지원합니다. 와 함께 이용할 수 있습니다.컨택 센터 통합Amazon Lex V2에서 지원합니다. 이테스트 창Amazon Lex V2 콘솔에서는 16kHz 오디오 입력을 사용하기 때문에 사용자 지정 어휘를 지원하지 않습니다.

Amazon Lex V2는 사용자 지정 어휘를 사용하여 인텐트와 슬롯을 모두 이끌어냅니다. 독립적으로 구성할 수 있습니다.

의도 유발— 의도 유출을 위한 사용자 지정 어휘를 만들 수 있습니다. 이 문구는 봇이 사용자의 의도를 결정할 때 기록하는 데 사용됩니다. 예를 들어, 사용자 지정 어휘에서 “백업”이라는 문구를 구성한 경우 Amazon Lex V2는 사용자 입력을 “내 사진을 백업해 주시겠습니까?” — 오디오가 “내 사진을 포장해 주시겠습니까?” 처럼 들리는 경우에도 마찬가지입니다. 가중치를 1, 2 또는 3으로 구성하여 각 구문에 대한 부스팅 정도를 지정할 수도 있습니다.

의도 추출 중 전사 개선에 사용되는 사용자 지정 어휘는 슬롯을 유도하는 동안 전사에 영향을 미치지 않습니다. 의도 지정을 위한 사용자 지정 어휘 작성에 대한 자세한 내용은 단원을 참조하십시오.인텐트를 유도하기 위한 사용자 지정 어휘 만들기.

사용자 정의 슬롯 이끌어 내기— 사용자 지정 어휘를 사용하여 오디오 대화의 슬롯 인식을 향상시킬 수 있습니다. 슬롯 값을 인식하는 Amazon Lex V2 봇의 기능을 향상시키려면 사용자 지정 슬롯을 생성하고 사용자 지정 슬롯에 슬롯 값을 추가한 다음슬롯 값을 사용자 지정 어휘로 사용. 슬롯 값의 예로는 제품 이름, 카탈로그 또는 적절한 명사가 있습니다. 사용자 지정 어휘에는 “예” 및 “아니오”와 같은 일반적인 단어나 문구를 사용해서는 안 됩니다.

슬롯 값이 추가되면 봇이 사용자 정의 슬롯에 대한 입력을 기대할 때 슬롯 인식을 향상시키는 데 사용됩니다. 이러한 값은 인텐트를 유도할 때 전사에 사용되지 않습니다. 자세한 정보는 슬롯 유형 추가을 참조하십시오.

사용자 지정 어휘를 만들기 위한 모범 사례

의도 유발

  • 사용자 지정 어휘는 특정 단어 또는 구절을 대상으로 사용하기에 가장 적합합니다. Amazon Lex V2에서 쉽게 인식하지 못하는 경우에만 사용자 지정 어휘에 단어를 추가합니다.

  • 전사에서 단어가 인식되지 않는 빈도와 입력에 있는 단어가 얼마나 드문 지에 따라 단어를 줄 가중치를 결정합니다. 발음하기 어려운 단어는 더 높은 무게가 필요합니다.

  • 대표적인 테스트 세트를 사용하여 중량이 적절한지 확인합니다. 대화 로그에서 오디오 로깅을 켜서 오디오 테스트 세트를 수집할 수 있습니다.

  • 사용자 지정 어휘에서 “on”, “it”, “to”, “예”, “아니오”와 같은 짧은 단어를 사용하지 마십시오.

사용자 정의 슬롯 이끌어 내기

  • 인식될 것으로 예상되는 사용자 정의 슬롯 유형에 값을 추가합니다. 슬롯 값이 얼마나 일반적이든 드물더라도 사용자 정의 슬롯 유형에 대해 가능한 모든 슬롯 값을 추가합니다.

  • 사용자 정의 슬롯 유형에 카탈로그 값 또는 제품 이름 또는 뮤추얼 펀드와 같은 엔티티 목록이 포함된 경우에만 이 옵션을 활성화합니다.

  • 슬롯 유형이 “예”, “아니오”, “모르겠습니다”, “어쩌면” 또는 “one”, “two”, “3"과 같은 일반 단어와 같은 일반 문구를 캡처하는 데 사용되는 경우 이 옵션을 비활성화합니다.

  • 최상의 성능을 위해 슬롯 값과 동의어 수를 500 이하로 제한합니다.

머리글자어 또는 문자를 개별적으로 발음해야 하는 기타 단어를 마침표 및 공백으로 구분된 단일 문자로 입력합니다. “J. P. Morgan” 또는 “A. W. S.” 대문자 또는 소문자를 사용해 머리글자어를 정의할 수 있습니다.

인텐트를 유도하기 위한 사용자 지정 어휘 만들기

Amazon Lex V2 콘솔을 사용하여 사용자 지정 어휘를 생성 및 관리하거나 Amazon Lex V2 API 작업을 사용할 수 있습니다.

콘솔을 사용하여 사용자 지정 어휘를 만들려면

  1. 사용자 지정 어휘에 추가하려는 문구가 있는 zip 파일을 만듭니다. 자세한 정보는 사용자 지정 어휘 파일 만들기을 참조하십시오.

  2. 에서 Amazon Lex V2 콘솔을 엽니다.https://console.aws.amazon.com/lexv2/home

  3. 봇 목록에서 사용자 지정 어휘를 추가하려는 봇을 선택합니다.

  4. 봇 세부 정보 페이지의언어 추가섹션 선택언어 보기.

  5. 언어 목록에서 사용자 지정 어휘를 추가할 언어를 선택합니다.

  6. 에서사용자 지정 어휘섹션 선택가져오기.

  7. 가져올 파일을 찾아서 필요한 경우 암호를 입력한 다음가져오기.

API를 사용하여 사용자 지정 어휘를 만들려면

  1. 사용자 지정 어휘에 추가하려는 문구가 있는 zip 파일을 만듭니다. 자세한 정보는 사용자 지정 어휘 파일 만들기을 참조하십시오.

  2. 사용CreateUploadUrl가져오기 ID를 가져오고 URL을 업로드하는 작업입니다. 의 응답CreateUploadUrl작업은 다음과 같은 모양입니다.

    { "importId": "string", "uploadUrl": "string" }
  3. 사용StartImport사용자 지정 어휘 파일을 업로드 URL에 업로드하는 작업입니다. 가져오기 ID는 특정 가져오기를 지정합니다.

  4. ListImportsDescribeImport사용자 지정 어휘를 가져오는 진행 상황을 확인하는 작업입니다.

사용자 지정 어휘 파일 만들기

사용자 지정 어휘 파일은 인식할 문구와 부스트를 줄 가중치를 포함하는 탭으로 구분된 값 목록입니다. 부스트 값이 더 높은 문구는 오디오 입력에 나타날 때 사용될 가능성이 높습니다.

사용자 지정 어휘 파일의 이름을 지정해야 합니다.CustomVocabulary.tsv을 (를) 가져오려면 먼저 zip 파일로 압축해야 합니다. zip 파일의 크기는 300MB 미만이어야 합니다. 사용자 지정 어휘의 최대 구문 수는 500개입니다.

  • 인식되어야 하는 1—4 단어. 구문의 단어를 공백으로 구분합니다. 파일에 중복 구절을 사용할 수 없습니다. 구절 필드는 필수입니다.

  • 무게— 구절 인식이 향상되는 정도입니다. 값은 정수 1, 2 또는 3입니다. 가중치를 지정하지 않을 경우 기본값은 1입니다. 전사에서 단어가 인식되지 않는 빈도와 입력에서 단어가 얼마나 드문 지에 따라 가중치를 결정하십시오.

사용자 지정 어휘 파일에는 머리글 “구문”과 “weight”가 있는 머리글 행이 포함되어야 합니다. 헤더는 순서에 관계없이 사용할 수 있지만 소문자를 사용해야 합니다.

다음은 사용자 지정 어휘 파일입니다. 문구와 가중치를 구분하는 데 필요한 탭 문자는 “[TAB]” 텍스트로 표시됩니다. 이 예제를 사용하는 경우 텍스트를 탭 문자로 바꿉니다.

phrase[TAB]weight Newcastle[TAB]2 Hobart[TAB]2 U. Dub[TAB]1 W. S. U.[TAB]3 Issaquah Kennewick