语音识别基本原理_计算机应用

语音识别基本原理

点击数：7512 次录入时间：03-04 11:59:32 整理：http://www.55dianzi.com 计算机应用

　　语音识别系统构建整体上包括两部分：训练和语音识别。训练是指搜集海量的语音、语言数据库进行信号处理和构建模板。在训练工程中，语音识别技术基于对语音的物理属生（主要包括音高、音长、音强和音色四个要素。音高是指声音的高低，主要决定于发音体振动速度的快慢；音长是指声音的长短，主要决定于发音体振动时间的久暂；音强是指声音的强弱，主要决定于发音体振动幅度的大小；音色是指声音的特色，主要决定干发音物体振动所形成的音波波纹曲折形式不同）、生理属性（主要指发音器官对语音的影响，包括肺和气管、喉头和声带以及口腔、鼻腔和咽腔等发音气官）和社会属性（一是语音与意义之间并无必然联系，它们的对应关系是社会成员约定俗成的；二是各种语言或方言都有自己的语音系统；三是语音具有区别意义的作用）等基本属性进行整理和分析。语音识别则是从语音波形中提取出随时间变化的语音特征序列，然后按照一种有效的方法，计算语音特征矢量序列和发音模板之间的距离。
　　
　　在辨识时将语音特征同声学模型进行匹配与比较，达到最佳识别结果。当分类发生错误时，可根据同声学模型进行判断纠正，特别是一些同音字，必须通过上下文确定其意义，从而得到准确的语音识别效果。
　　
　　因此，语音识别技术具备以下三个原理：第一，语音信号中的语言信息是按照短时幅度谱的时间变化模式来编码的；第二，语音是可以阅读的，即它的声学信号可以在不考虑说话人试图传达的信息内容的情况下用数十个具有区别性的、离散的符号来表示；第三，语音交互是一个认知过程，因而不能与语言的语法、语义和语用结构割裂开来。