学位论文 > 优秀研究生学位论文题录展示
基于STRAIGHT谱的语音识别算法研究
作 者: 姚建霄
导 师: 张歆奕
学 校: 五邑大学
专 业: 信号与信息处理
关键词: 语音识别 STRAIGHT谱 差别子空间 对应点映射 锚点
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 71次
引 用: 0次
阅 读: 论文下载
内容摘要
人类利用语言相互交流信息。在高度信息化的今天,语音信息处理的一系列技术及其应用已经成为信息社会不可或缺的重要组成部分。语音识别技术能让计算机把语音信号转变为相应的文本或命令的技术,使人们能够摆脱对键盘的依赖,通过语音与计算机进行对话。在各种描述语音信号的特征参数中,语谱图具有其他种类参数所不具备的特点。它综合了时域分析和频域分析的优点,更全面的表达出信号时域和频域特征之间的关系,缺点是包含更多的冗余性。随着计算机存储容量和计算速度的逐渐改进,这个缺点对语谱图的应用限制已经不明显。从原理上讲,语音识别系统中应用最多的特征参数线性预测倒谱系数和梅尔倒谱系数,它们都是通过各种方法将语音信号分解得到激励信号和声道冲击响应,并从反映声道冲击响应的信息中得到倒谱系数。同样,STRAIGHT算法也是将语音分解为相互独立的频谱参数和一系列脉冲的卷积,并以谱图的形式表示这些频谱参数(STRAIGHT谱)。这就提供了将STRAIGHT谱应用于语音识别的理论依据。差别子空间法是一种有效的模型训练方法,理论证明和实验结果均表明用这种方法训练得到的模板与训练样本的选择无关,并且随着训练样本数的增多,所得到的模板能更好的表示该类的特点。本文中笔者设计的语音识别系统选择STRAIGHT谱作为语音特征参数,用差别子空间法进行模板训练。除此之外,本文又引入了对应点映射方法,这种方法能比DTW方法更好地解决不同语音样本比较时子单元之间的对准问题,从而更好地解决了非特定人识别问题。在Matlab环境下,笔者搭建了基于上述方法的语音识别系统。用于验证的语音材料来自于多位同学于不同时间多次录制的汉语数字1~10的录音。实验结果表明用这种方法可以达到满意的郊果。
|
全文目录
相似论文
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 在智能手机环境下健康管理功能设计与研究,TN929.53
- 移动音视频交互业务执行平台的研究,TN915.09
- 呼叫中心IVR系统的设计与实现,TN99
- 基于HMM的机器人语音识别系统的研究,TN912.34
- 基于改进MFCC的语音识别系统研究及设计,TN912.34
- 仿真机器人控制系统,TP242
- 基于VoiceXML的语音智能交互平台的研究与实现,TP311.52
- 基于词片网格的语音文档主题分类,TN912.3
- 基于HMM和PNN的混合语音识别模型研究,TN912.34
- 移动机器人语音识别控制仿真系统的设计与实现,TN912.34
- 基于动态贝叶斯网络的连续语音识别研究,TN912.34
- 面向机器人对话的语音识别关键技术的研究,TN912.34
- 基于自适应的LVCSR系统半监督学习方法的研究,TN912.34
- 汉语语音识别中语言模型的并行优化,TN912.34
- 基于双自由度自适应轮系多功能代步车,U489
- 基于切分的汉语连续语音识别技术研究,TN912.34
- 基于支持向量机的民族语语种识别研究,TN912.34
- 基于音素的错误发音自动检测方法研究与应用,TN912.34
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|