了解 Amazon Chime SDK 的 AWS Glue 数据目录表
下表列出并描述了 Amazon Chime SDK 呼叫分析 Glue 数据目录中的列、数据类型和元素。
主题
call_analytics_metadata
列名称 |
数据类型 |
元素 |
定义 |
---|---|---|---|
时间 |
字符串 |
事件生成时间戳 ISO 8601。 |
|
detail-type |
字符串 |
与 service-type 相关的功能类型。 |
|
service-type |
字符串 |
AWS 服务的名称,VoiceAnalytics 或 CallAnalytics。 |
|
detail-subtype |
字符串 |
用于记录和 CallAnalyticsMetadata detail-type。 |
|
callevent-type |
字符串 |
与 SIP 关联的事件类型,例如更新、暂停、恢复 |
|
mediaInsightsPipelineId |
字符串 |
Amazon Chime SDK 媒体见解管线 ID。 |
|
metadata |
字符串 |
voiceConnectorId |
Amazon Chime SDK 语音连接器 ID。 |
callId |
与使用情况相关的参与者的呼叫 ID。 |
||
transactionId |
呼叫的事务 ID。 |
||
fromNumber |
E.164 发起电话号码。 |
||
toNumber |
E.164 目标电话号码。 |
||
方向 |
呼叫方向,出站或入站。 |
||
oneTimeMetadata.s3RecordingUrl |
由 Transcribe 呼叫分析发出的媒体对象的 Amazon S3 存储桶 URL。 |
||
oneTimeMetadata.s3RecordingUrlRedacted |
由 Transcribe 呼叫分析发出的编辑后媒体对象的 Amazon S3 存储桶 URL。 |
||
oneTimeMetadata.siprecMetadata |
与呼叫相关的 XML 格式的 SIPREC 元数据。 |
||
oneTimeMetadata.siprecMetadataJson |
与呼叫相关的 JSON 格式的 SIPREC 元数据。 |
||
oneTimeMetadata.InviteHeaders |
邀请标头。 |
call_analytics_recording_metadata
列名称 |
数据类型 |
元素 |
定义 |
---|---|---|---|
时间 |
字符串 |
事件生成时间戳 ISO 8601。 |
|
detail-type |
字符串 |
与 service-type 相关的功能类型。 |
|
service-type |
字符串 |
AWS 服务的名称,VoiceAnalytics 或 CallAnalytics。 |
|
detail-subtype |
字符串 |
用于记录和 CallAnalyticsMetadata detail-type。 |
|
callevent-type |
字符串 |
与 SIP 关联的事件类型 |
|
mediaInsightsPipelineId |
字符串 |
Amazon Chime SDK 媒体见解管线 ID。 |
|
s3MediaObjectConsoleUrl |
字符串 |
媒体对象的 S3 存储桶 URL。 |
|
metadata |
字符串 |
voiceConnectorId |
Amazon Chime SDK 语音连接器 ID。 |
callId |
与使用情况相关的参与者的呼叫 ID。 |
||
transactionId |
呼叫的事务 ID。 |
||
fromNumber |
E.164 发起电话号码。 |
||
toNumber |
E.164 目标电话号码。 |
||
方向 |
呼叫方向,出站或入站。 |
||
语音增强 |
与 service-type 相关的功能子类型。 |
||
oneTimeMetadata.siprecMetadata |
与呼叫相关的 XML 格式的 SIPREC 元数据。 |
||
oneTimeMetadata.siprecMetadataJson |
与呼叫相关的 JSON 格式的 SIPREC 元数据。 |
||
oneTimeMetadata.InviteHeaders |
邀请标头。 |
transcribe_call_analytics
列名称 |
数据类型 |
元素 |
定义 |
---|---|---|---|
时间 |
字符串 |
事件生成时间戳 ISO 8601。 |
|
detail-type |
字符串 |
与 service-type 相关的功能类型。 |
|
service-type |
字符串 |
AWS 服务的名称,VoiceAnalytics 或 CallAnalytics。 |
|
mediaInsightsPipelineId |
字符串 |
Amazon Chime SDK 媒体见解管线 ID。 |
|
metadata |
字符串 |
voiceConnectorId |
Amazon Chime 语音连接器 ID。 |
callId |
与使用情况相关的参与者的呼叫 ID。 |
||
transactionId |
呼叫的事务 ID。 |
||
fromNumber |
E.164 发起电话号码。 |
||
toNumber |
E.164 目标电话号码。 |
||
方向 |
呼叫方向, |
||
UtteranceEvent |
struct |
UtteranceId |
与指定 |
IsPartial |
指示 |
||
ParticipantRole |
为每个音频通道提供发言人角色,可以是客户或座席。 |
||
BeginOffsetMillis |
从音频流开始到 |
||
EndOffsetMillis |
从音频流开始到 |
||
转录 |
包含转录后文本。 |
||
情绪 |
提供在指定片段中检测到的情绪。 |
||
Items.beginoffsetmillis |
转录后内容的开始时间,以毫秒为单位。 |
||
Items.endoffsetmillis |
转录后内容的结束时间,以毫秒为单位。 |
||
Items.itemtype |
识别内容的类型。选项: |
||
Items.content |
转录的单词或标点符号。 |
||
Items.confidence |
与您的转录中的单词或短语相关的置信度分数。分数是介于 0 和 1 之间的值。值越大,指示识别内容与您的媒体中所说内容正确匹配的可能性越高。 |
||
Items.vocabularyfiltermatch |
指示指定内容是否与您请求中所含词汇筛选器中的单词匹配。如果为 true,则存在词汇筛选匹配项。 |
||
Items.stable |
已启用部分结果稳定,“稳定”指示指定内容是稳定的 (true),还是在片段完成后可能发生变化 (false)。 |
||
IssuesDetected.characteroffsets_begin |
提供识别匹配项的第一个字符的字符计数。例如,与议题或类别相关的第一个字符与片段转录中的内容相匹配。 |
||
IssuesDetected.characteroffsets_end |
提供识别匹配项的最后一个字符的字符计数。例如,与议题或类别相关的最后一个字符与片段转录中的内容相匹配。 |
||
Entities.beginoffsetmillis |
识别为 |
||
Entities.endoffsetmillis |
识别为 |
||
Entities.category |
识别信息的类别。唯一的类别是 |
||
Entities.type |
识别 PII 的类型。例如, |
||
Entities.content |
识别为 |
||
Entities.confidence |
与您的音频中识别 |
transcribe_call_analytics_category_events
列名称 |
数据类型 |
元素 |
定义 |
---|---|---|---|
时间 |
字符串 |
事件生成时间戳 ISO 8601。 |
|
detail-type |
字符串 |
与 service-type 相关的功能类型。 |
|
service-type |
字符串 |
AWS 服务的名称,VoiceAnalytics 或 CallAnalytics。 |
|
mediaInsightsPipelineId |
字符串 |
Amazon Chime SDK 媒体见解管线 ID。 |
|
metadata |
字符串 |
voiceConnectorId |
Amazon Chime 语音连接器 ID。 |
callId |
与使用情况相关的参与者的呼叫 ID。 |
||
transactionId |
呼叫的事务 ID。 |
||
fromNumber |
E.164 发起电话号码。 |
||
toNumber |
E.164 目标电话号码。 |
||
方向 |
呼叫方向,出站或入站。 |
||
CategoryEvent |
数组 |
MatchedCategories |
列出由用户定义的类别中的匹配项。 |
transcribe_call_analytics_post_call
列名称 |
数据类型 |
元素 |
定义 |
---|---|---|---|
JobStatus |
字符串 |
事件生成时间戳 ISO 8601。 |
|
LanguageCode |
字符串 |
与 service-type 相关的功能类型。 |
|
转录 |
struct |
LoudnessScores |
测量每位参与者的说话音量。使用此指标来查看呼叫者或座席是否大声说话或者大喊大叫,这通常表示愤怒。 该指标表示为标准化值(给定片段中每秒的话音水平),范围从 0 到 100,其中值越高表示声音越大。 |
内容 |
包含转录后文本。 |
||
Id |
与指定 |
||
BeginOffsetMillis |
从音频流开始到 |
||
EndOffsetMillis |
从音频流开始到 |
||
情绪 |
提供在指定转录片段中检测到的情绪。 |
||
ParticipantRole |
为每个音频通道提供发言人角色,可以是客户或座席。 |
||
IssuesDetected.CharacterOffsets.Begin |
提供识别匹配项的第一个字符的字符偏移量。例如,转录片段中与议题相关的第一个字符。 |
||
IssuesDetected.CharacterOffsets.End |
提供识别匹配项的最后一个字符的字符偏移量。例如,转录片段中与议题相关的最后一个字符。 |
||
OutcomesDetected.CharacterOffsets.Begin |
提供在呼叫中识别的结果或决议。 |
||
OutcomesDetected.CharacterOffsets.End |
|||
ActionItemsDetected.CharacterOffsets.Begin |
列出在呼叫中识别的所有操作内容。 |
||
ActionItemsDetected.CharacterOffsets.End |
|||
AccountId |
字符串 |
AWS 账户 ID |
|
类别 |
struct |
MatchedCategories |
列出匹配的类别。 |
MatchedDetails |
列出从音频流开始到检测到该类别中的匹配项的时间,以毫秒为单位。 |
||
频道 |
字符串 |
频道 |
指示语音通道。 |
参与者 |
数组 |
ParticipantRole |
为每个音频通道提供发言人角色, |
ConversationCharacteristics |
struct |
NonTalkTime |
测量不含话音的时间段。使用此指标来查找长时间的静默,例如客户等待的时间过长。 |
中断 |
测量一个参与者是否以及何时打断了另一个参与者的话。频繁中断可能与粗鲁或愤怒相关,也可能与一个或两个参与者的消极情绪相关。 |
||
TotalConversationDurationMillis |
对话的总时长。 |
||
Sentiment.OverallSentiment.AGENT |
代理的 |
||
Sentiment.OverallSentiment.CUSTOMER |
|
||
Sentiment.SentimentByPeriod.QUARTER.AGENT |
|
||
Sentiment.SentimentByPeriod.QUARTER.CUSTOMER |
|
||
TalkSpeed |
测量两个参与者的说话速度。如果一个参与者说话太快,理解力就会受到影响。该指标以每分钟单词数来衡量。 |
||
TalkTime |
测量每个参与者在呼叫期间的说话时长,以毫秒为单位。使用此指标来帮助识别是否有一名参与者在呼叫中占据主导地位,或者对话是否平衡。 |
||
SessionId |
字符串 |
呼叫的 |
|
ContentMetadata |
字符串 |
根据客户指定的配置来标记原始内容与编辑后内容的字段。 |
transcribe
列名称 |
数据类型 |
元素 |
定义 |
---|---|---|---|
时间 |
字符串 |
事件生成时间戳 ISO 8601。 |
|
detail-type |
字符串 |
与 service-type 相关的功能类型。 |
|
service-type |
字符串 |
AWS 服务的名称,VoiceAnalytics 或 CallAnalytics。 |
|
mediaInsightsPipelineId |
字符串 |
Amazon Chime SDK 媒体见解管线 ID。 |
|
metadata |
字符串 |
voiceConnectorId |
Amazon Chime 语音连接器 ID。 |
callId |
与使用情况相关的参与者的呼叫 ID。 |
||
transactionId |
呼叫的事务 ID。 |
||
fromNumber |
E.164 发起电话号码。 |
||
toNumber |
E.164 目标电话号码。 |
||
方向 |
呼叫方向, |
||
TranscriptEvent |
struct |
ResultId |
|
StartTime |
|
||
EndTime |
|
||
IsPartial |
表明片段是否是完整的。如果 |
||
ChannelId |
与音频流相关的通道的 ID。 |
||
Alternatives.Entities |
包含您的转录输出中识别为个人身份信息 (PII) 的实体。 |
||
Alternatives.Items.Confidence |
与您的转录中的单词或短语相关的置信度分数。置信度分数是介于 0 和 1 之间的值。值越大,指示识别内容与您的媒体中所说内容正确匹配的可能性越高。 |
||
Alternatives.Items.Content |
转录的单词或标点符号。 |
||
Alternatives.Items.EndTime |
转录后内容的结束时间,以毫秒为单位。 |
||
Alternatives.Items.Speaker |
如果启用了发言人分区, |
||
Alternatives.Items.Stable |
如果启用了部分结果稳定, |
||
Alternatives.Items.StartTime |
转录后内容的开始时间,以毫秒为单位。 |
||
Alternatives.Items.Type |
识别内容的类型。选项: |
||
Alternatives.Items.VocabularyFilterMatch |
指示指定内容是否与您请求中所含词汇筛选器中的单词匹配。如果为 true,则存在词汇筛选匹配项。 |
||
Alternatives.Transcript |
包含转录后文本。 |
voice_analytics_status
列名称 |
数据类型 |
元素 |
定义 |
---|---|---|---|
时间 |
字符串 |
事件生成时间戳 ISO 8601。 |
|
detail-type |
字符串 |
与 service-type 相关的功能类型。 |
|
service-type |
字符串 |
AWS 服务的名称,VoiceAnalytics 或 CallAnalytics。 |
|
源 |
字符串 |
生成事件的 AWS 服务。 |
|
account |
字符串 |
AWS 账户 ID。 |
|
region |
字符串 |
AWS 账户区域。 |
|
版本 |
字符串 |
事件架构的版本。 |
|
id |
字符串 |
事件的唯一 ID |
|
detail |
struct |
taskId |
任务的唯一 ID。 |
isCaller |
指示参与者是否为呼叫者。 |
||
streamStartTime |
流的开始时间。 |
||
transactionId |
呼叫的事务 ID。 |
||
voiceConnectorId |
Amazon Chime 语音连接器 ID。 |
||
callId |
与使用情况相关的参与者的呼叫 ID。 |
||
detailStatus |
与 service-type 相关的详细功能类型。 |
||
statusMessage |
任务 ID 成功或失败的状态。 |
||
mediaInsightsPipelineId |
Amazon Chime SDK 媒体见解管线 ID。此字段仅在通过媒体管道 SDK 而不是语音 SDK 启动的发言人搜索任务时才会填充。 |
||
sourceArn |
在其上运行任务的资源 ARN |
||
streamArn |
为其运行任务的 Kinesis 视频流 ARN。此字段仅在通过媒体管道 SDK 而不是语音 SDK 启动的发言人搜索任务时才会填充。 |
||
channelId |
为其运行任务的 StreamArn 的通道。此字段仅在通过媒体管道 SDK 而不是语音 SDK 启动的发言人搜索任务时才会填充。 |
||
speakerSearchDetails.voiceProfileId |
已注册语音配置文件的 ID,其语音嵌入与呼叫中的发言人非常匹配。 |
||
speakerSearchDetails.confidenceScore |
介于 [0, 1] 之间的数字,其中,数字越大,意味着机器学习模型对语音配置文件匹配越有信心。 |
speaker_search_status
列名称 |
数据类型 |
元素 |
定义 |
---|---|---|---|
时间 |
字符串 |
事件生成时间戳 ISO 8601。 |
|
detail-type |
字符串 |
与 service-type 相关的功能类型。 |
|
service-type |
字符串 |
AWS 服务的名称,VoiceAnalytics 或 CallAnalytics。 |
|
源 |
字符串 |
生成事件的 AWS 服务。 |
|
account |
字符串 |
AWS 账户 ID。 |
|
region |
字符串 |
AWS 账户区域。 |
|
版本 |
字符串 |
事件架构的版本。 |
|
id |
字符串 |
事件的唯一 ID |
|
detail |
struct |
taskId |
任务的唯一 ID。 |
isCaller |
指示参与者是否为呼叫者。 |
||
transactionId |
呼叫的事务 ID。如果任务源自通过语音连接器拨打的呼叫,则会填充此字段。 |
||
voiceConnectorId |
Amazon Chime 语音连接器 ID。如果任务源自通过语音连接器拨打的呼叫,则会填充此字段。 |
||
mediaInsightsPipelineId | 媒体见解管线 ID。此字段仅在通过媒体管道 SDK 而不是语音 SDK 启动的发言人搜索任务时才会填充。 | ||
sourceArn | 在其上运行任务的资源 ARN。 | ||
streamArn | 为其运行任务的 Kinesis 视频流 ARN。此字段仅在通过媒体管道 SDK 而不是语音 SDK 启动的发言人搜索任务时才会填充。 | ||
channelId | 为其运行任务的 StreamArn 的通道。此字段仅在通过媒体管道 SDK 而不是语音 SDK 启动的发言人搜索任务时才会填充。 | ||
participantRole | 与 streamArn 中 channelId 相关的参与者角色。此字段仅在通过媒体管道 SDK 而不是语音 SDK 启动的发言人搜索任务时才会填充。 | ||
detailStatus |
与 service-type 相关的详细功能类型。 |
||
statusMessage |
任务 ID 的状态,成功或失败。 |
||
speakerSearchDetails.voiceProfileId |
已注册语音配置文件的 ID,其语音嵌入与呼叫中的发言人非常匹配。 |
||
speakerSearchDetails.confidenceScore |
介于 [0, 1] 之间的数字,其中,数字越大,意味着机器学习模型对语音配置文件匹配越有信心。 |
voice_tone_analysis_status
列名称 |
数据类型 |
元素 |
定义 |
---|---|---|---|
时间 |
字符串 |
事件生成时间戳 ISO 8601。 |
|
detail-type |
字符串 |
与 service-type 相关的功能类型。 |
|
service-type |
字符串 |
AWS 服务的名称,VoiceAnalytics 或 CallAnalytics。 |
|
源 |
字符串 |
生成事件的 AWS 服务。 |
|
account |
字符串 |
AWS 账户 ID。 |
|
region |
字符串 |
AWS 账户区域。 |
|
版本 |
字符串 |
事件架构的版本。 |
|
id |
字符串 |
事件的唯一 ID |
|
detail |
struct |
taskId |
任务的唯一 ID。 |
isCaller |
指示参与者是否为呼叫者。 |
||
transactionId |
呼叫的事务 ID。如果任务源自通过语音连接器拨打的呼叫,则会填充此字段。 |
||
voiceConnectorId |
Amazon Chime 语音连接器 ID。如果任务源自通过语音连接器拨打的呼叫,则会填充此字段。 |
||
mediaInsightsPipelineId | 媒体见解管线 ID。此字段仅在通过媒体管道 SDK 而不是语音 SDK 启动的发言人搜索任务时才会填充。 | ||
sourceArn | 在其上运行任务的资源 ARN。 | ||
streamArn | 为其运行任务的 Kinesis 视频流 ARN。此字段仅在通过媒体管道 SDK 而不是语音 SDK 启动的发言人搜索任务时才会填充。 | ||
channelId | 为其运行任务的 StreamArn 的通道。此字段仅在通过媒体管道 SDK 而不是语音 SDK 启动的发言人搜索任务时才会填充。 | ||
participantRole | 与 streamArn 中 channelId 相关的参与者角色。此字段仅在通过媒体管道 SDK 而不是语音 SDK 启动的发言人搜索任务时才会填充。 | ||
statusMessage |
任务 ID 成功或失败的状态。 |
||
voiceToneAnalysisDetails.startFragmentNumber | 与 streamArn 相关的起始片段编号。 | ||
voiceToneAnalysisDetails.currentAverageVoiceTone.startTime |
ISO8601 格式的起始时间戳,表示当前平均情绪所依据的发言人呼叫音频。 |
||
voiceToneAnalysisDetails.currentAverageVoiceTone.endTime |
ISO8601 格式的结束时间戳,表示当前平均情绪所依据的发言人呼叫音频。 |
||
voiceToneAnalysisDetails.currentAverageVoiceTone.beginOffsetMillis | 当前平均情绪所依据的发言人呼叫音频起始片段的起始偏移量,以毫秒为单位。 | ||
voiceToneAnalysisDetails.currentAverageVoiceTone.endOffsetMillis | 当前平均情绪所依据的发言人呼叫音频起始片段的结束偏移量,以毫秒为单位。 | ||
voiceToneAnalysisDetails.currentAverageVoiceTone.voiceToneScore.positive |
发言人积极情绪的概率可能性介于 [0, 1] 之间。 |
||
voiceToneAnalysisDetails.currentAverageVoiceTone.voiceToneScore.negative |
发言人消极情绪的概率可能性介于 [0, 1] 之间。 |
||
voiceToneAnalysisDetails.currentAverageVoiceTone.voiceToneScore.neutral |
发言人中性情绪的概率可能性介于 [0, 1] 之间。 |
||
voiceToneAnalysisDetails.currentAverageVoiceTone.voiceToneLabel |
最高概率具有平均语音音调分数的标签。 |
||
voiceToneAnalysisDetails.overallAverageVoiceTone.startTime |
ISO8601 格式的起始时间戳,表示总体平均情绪所依据的发言人呼叫音频。 |
||
voiceToneAnalysisDetails.overallAverageVoiceTone.endTime |
ISO8601 格式的结束时间戳,表示总体平均情绪所依据的发言人呼叫音频。 |
||
voiceToneAnalysisDetails.overallAverageVoiceTone.beginOffsetMillis | 总体平均情绪所依据的发言人呼叫音频起始片段的起始偏移量,以毫秒为单位。 | ||
voiceToneAnalysisDetails.overallAverageVoiceTone.endOffsetMillis | 总体平均情绪所依据的发言人呼叫音频起始片段的结束偏移量,以毫秒为单位。 | ||
voiceToneAnalysisDetails.overallAverageVoiceTone.voiceToneScore.positive |
发言人积极情绪的概率可能性介于 [0, 1] 之间。 |
||
voiceToneAnalysisDetails.overallAverageVoiceTone.voiceToneScore.negative |
发言人消极情绪的概率可能性介于 [0, 1] 之间。 |
||
voiceToneAnalysisDetails.overallAverageVoiceTone.voiceToneScore.neutral |
发言人中性情绪的概率可能性介于 [0, 1] 之间。 |
||
voiceToneAnalysisDetails.overallAverageVoiceTone.voiceToneLabel |
情绪分数最高的情绪标签(积极、消极或中性)。 |