语音识别技术是什么 语音识别基本方法介绍 语音识别技术原理详解
2023-08-19 04:25:43 来源:
语音识别技术,语音识别技术是什么意思
(资料图)
语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。
语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
特定人语音识别的方法
目前,常用的说话人识别方法有模板匹配法、统计建模法、联接主义法(即人工神经网络实现)。考虑到数据量、实时性以及识别率的问题,笔者采用基于矢量量化和隐马尔可夫模型(HMM)相结合的方法。
说话人识别的系统主要由语音特征矢量提取单元(前端处理)、训练单元、识别单元和后处理单元组成,其系统构成1所示。
由上图也可以看出,每个司机在购买车后必须将自己的语音输入系统,也就是训练过程,当然最好是在安静、次数达到一定的数目。从此在以后驾驶过程中就可以利用这个系统了。
所谓预处理是指对语音信号的特殊处理:预加重,分帧处理。预加重的目的是提升高频部分,使信号的频谱变得平坦,以便于进行频谱分析或声道参数分析。用具有 6dB/倍频程的提升高频特性的预加重数字滤波器实现。虽然语音信号是非平稳时变的,但是可以认为是局部短时平稳。故语音信号分析常分段或分帧来处理。
历史
早在计算机发明之前,自动语音识别的设想就已经被提上了议事日程,早期的声码器可被视作语音识别及合成的雏形。而1920年代生产的"Radio Rex"玩具狗可能是最早的语音识别器,当这只狗的名字被呼唤的时候,它能够从底座上弹出来。最早的基于电子计算机的语音识别系统是由AT&T贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字。其识别方法是跟踪语音中的共振峰。该系统得到了98%的正确率。到1950年代末,伦敦学院(Colledge of London)的Denes已经将语法概率加入语音识别中。
1960年代,人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码Linear Predictive Coding (LPC), 及动态时间弯折Dynamic Time Warp技术。
语音识别技术的最重大突破是隐含马尔科夫模型Hidden Markov Model的应用。从Baum提出相关数学推理,经过Labiner等人的研究,卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx。[3]。此后严格来说语音识别技术并没有脱离HMM框架。
尽管多年来研究人员一直尝试将“听写机”推广,语音识别技术在目前还无法支持无限领域,无限说话人的听写机应用。
模型
目前,主流的大词汇量语音识别系统多采用统计模式识别技术。典型的基于统计模式识别方法的 语音识别系统由以下几个基本模块所构成
信号处理及特征提取模块。该模块的主要任务是从输入信号中提取特征,供声学模型处理。同时,它一般也包括了一些信号处理技术,以尽可能降低环境噪声、信道、说话人等因素对特征造成的影响。 统计声学模型。典型系统多采用基于一阶隐马尔科夫模型进行建模。 发音词典。发音词典包含系统所能处理的词汇集及其发音。发音词典实际提供了声学模型建模单元与语言模型建模单元间的映射。 语言模型。语言模型对系统所针对的语言进行建模。理论上,包括正则语言,上下文无关文法在内的各种语言模型都可以作为语言模型,但目前各种系统普遍采用的还是基于统计的N元文法及其变体。 解码器。解码器是语音识别系统的核心之一,其任务是对输入的信号,根据声学、语言模型及词典,寻找能够以最大概率输出该信号的词串。 从数学角度可以更加清楚的了解上述模块之间的关系。首先,统计语音识别的最基本问题是,给定输入信号或特征序列,符号集(词典),求解符号串使得:
W = argmaxP(W | O) 通过贝叶斯公式,上式可以改写为
由于对于确定的输入串O,P(O)是确定的,因此省略它并不会影响上式的最终结果,因此,一般来说语音识别所讨论的问题可以用下面的公式来表示,可以将它称为语音识别的基本公式。 W = argmaxP(O | W)P(W)
关键词:
[责任编辑:]
相关阅读
- (2023-08-19)语音识别技术是什么 语音识别基本方法介绍 语音识别技术原理详解
- (2023-08-19)世界机器人大会盛大启幕 全球目光聚焦北京 一场行业盛会带动一个产业崛起
- (2023-08-19)在天涯畅享夏趣
- (2023-08-19)普利特:拟使用7500万元-1.5亿元回购公司股份
- (2023-08-19)宝信软件(600845.SH):上半年净利润11.62亿元,同比增长17.27%
- (2023-08-19)券商今日金股:24份研报力推一股(名单)
- (2023-08-19)缅甸1800万人需人道主义援助 联合国官员呼吁增加援助资金
- (2023-08-19)中电港(001287)8月16日主力资金净买入824.27万元
- (2023-08-19)吕蒙正不受镜文言文翻译及注释 吕蒙正不受镜
- (2023-08-19)老鼠怎么画高难度(老鼠怎么画)
- (2023-08-19)浙江恒威:目前,公司针对扣式锂锰电池已提前进行技术储备
- (2023-08-19)8月17日生意社DBP基准价为9750.00元/吨
- (2023-08-19)刘慈欣:接受、不干涉制片人和导演在影视化时对原著的改编
- (2023-08-19)史丹利:2023年半年度净利润约3.99亿元,同比增加7.58%
- (2023-08-19)董事长“秒回”:对方要讹诈!癌症早筛龙头被指“九成收入作假” 谁在做空?
- (2023-08-19)市财政局积极安排资金 全力支持气象监测预警预报
- (2023-08-19)储能电站的指挥官:储能EMS能源管理系统~
- (2023-08-19)培力农本方(01498.HK)8月29日举行董事会会议考虑及酌情批准中期业绩
- (2023-08-19)潍坊知识产权保护中心专利授权量突破万件
- (2023-08-19)能量奇点:国内目前尺寸最大的高温超导托卡马克磁体研制完成
- (2023-08-19)为学生夫妻安排一间宿舍两张床,武大的回应亮了
- (2023-08-19)新增“亚运车道”,能驶入吗?且看最新说明
- (2023-08-19)永嘉一江边垃圾场将变身滨水公园
- (2023-08-19)浙江恒威:目前,公司针对扣式锂锰电池已提前进行技术储备
- (2023-08-19)【考前老师有话说】中级会计考前李忠魁老师叮嘱您这些内容一定要看
- (2023-08-19)2023年中秋节加班费怎么算
- (2023-08-19)全市已建成109家胸痛救治单元
- (2023-08-19)今日林心如吻戏16个夏天(《夏家三千金》里严格和夏天美也有吻戏在里面吗怎么都没有看到哪集啊)
- (2023-08-19)海口三港恢复正常运输秩序
- (2023-08-19)无锡悦尚奥特莱斯音乐啤酒节期间禁飞通告