当先锋百科网

首页 1 2 3 4 5 6 7

ASR即自动语音识别。此项技术的目标是让计算机能够“听写”出不同人所说出的连续语音,也就是俗称的“语音听写机”,是实现“声音”到“文字”转换的技术。

当然,在呼叫中心领域,自动语音识别技术在应用方面比起一般PC系统的应用来说要更加困难,这主要体现在语音在经过压缩及线路传输之后,会有一定程度的失真,而且用户嘈杂的背景声音,以及来自天南地北的口音也都会对识别率造成影响,所以在传统的呼叫中心领域,ASR自动语音识别更多的是以一种辅助的姿态出现在功能清单之中。对于一个企业而言,了解客户的需求是企业调整战略部署最重要的依据,否则就有可能出现花费数十亿研制出来的新产品却无人问津的尴尬境地。一些企业为了实现这个目的,常用的方法是进行市场调查、或者由呼叫中心座席员向客户发起电话调查等等,但这些方法一是受访众的覆盖面积有限,二来客户不一定配合,有些情况下甚至还会引起客户的反感,如客户正在召开重要会议,突然一个调查电话不合时宜的响起,可以想像客户当时的恼怒,更不要提客户会积极配合企业的调查了。

米领通信智能语音分析系统对于该问题的解决之道是首先将海量的电话录音转为文本,这样就可以像使用搜索引擎那样来对通话进行关键字搜索,以找到有价值的通话录音。

ASR自动语音识别在呼叫中心系统中的应用,自动语音识别通常有以下几种分类方法:

1.按系统的用户情况分:特定人和非特定人识别系统;

2.按系统词汇量分:小词汇量、中词汇量和大词汇量系统;

3.按语音的输入方式分:孤立词、连接词、连续语音系统等;

4.按输入语音的发音方式分:朗读式、口语(自然发音)式;

5.按输入语音的方言背景情况分:普通话、方言背景普通话、方言语音识别系统;

6.按输入语音的情感状态分;中性语音、情感语音识别系统。

ASR自动语音识别在呼叫中心系统中的应用,英语通常采用上下文相关的音素建模,汉语的协同发音不如英语严重,可以采用音节建模。系统所需的训练数据大小与模型复杂度有关。模型设计得过于复杂以至于超出了所提供的训练数据的能力,会使得性能急剧下降。