学位论文 > 优秀研究生学位论文题录展示

基于听觉掩蔽效应的数字助听器算法研究及DSP的实现

作 者: 阚仁根
导 师: 于凤芹
学 校: 江南大学
专 业: 检测技术与自动化装置
关键词: 语音增强 听觉掩蔽 数字助听器
分类号: TP301.6
类 型: 硕士论文
年 份: 2008年
下 载: 227次
引 用: 3次
阅 读: 论文下载
 

内容摘要


耳聋已成为一个世界性的问题,解决耳聋问题的最直接手段是给耳聋患者戴上助听器,提高人耳对语音感知。数字助听器最大的优点是能够植入各种语音处理算法,改变语音的分布,提高人耳感知语音的舒适度和分辨率。数字助听器的诞生给耳聋患者带来了希望。本文重点研究了数字助听器的核心算法。将人耳的听觉掩蔽效应应用到数字助听器的核心算法中去,直接从人耳的听觉生理上出发,改善人耳对声音的听觉舒适度,并且把此算法在DSP上实现。本文首先分析了数字助听器三个核心算法:语音增强,宽动态压缩和移频压缩。传统的数字助听器算法忽略了人耳的生理特性,语音听觉舒适度没提高,针对算法的缺点,提出用基于听觉掩蔽效应的语音增强算法取代原语音增强算法。这样利用人耳的生理特性降低噪声,提高语音感知的舒适度。针对听觉掩蔽效应的语音增强算法,本文首先对噪声的估算运用了实时噪声估计,提高了噪声估计的准确性,降低了语音失真。还对原有算法中的听觉掩蔽阈值计算不准确,从而引起了谱减系数计算误差,导致语音失真过大的问题,提出了一种改进的计算方法。在原有的谱减系数计算公式中加入了一个修改参数θ来降低语音失真。实验仿真结果表明,本算法不但提高了语音信噪比,还改善了语音音质。其次就传统的宽动态压缩算法,在实现频谱增益时忽略了语音共振峰,频谱增益后引起了共振峰的非线性变化,改变了共振峰的频域分布,针对此问题提出了一种基于共振峰估计的宽动态压缩算法,减少了共振峰的非线性失真,改善了听觉舒适度。最后对数字助听器的三个核心算法进行了实验验证。利用合众达的SEED—DEC5416开发板,把数字数听器的三个核心算法植入其中,在此开发板上实现了三种语音处理功能。在算法的实现过程中,对其中出现的问题进行了分析研究。实践表明,该模块满足了语音的实时性并且达到了数字助听器语音处理的效果。

全文目录


摘要  3-4
ABSTRACT  4-7
第一章 绪论  7-11
  1.1 课题研究的背景及意义  7
  1.2 国内外研究的进展  7-9
    1.2.1 听觉掩蔽效应的语音增强  7-8
    1.2.2 数字助听器  8-9
  1.3 本文研究的内容  9-10
  1.4 论文结构  10-11
第二章 数字助听器的算法  11-23
  2.1 语音增强算法  11-13
    2.1.1 自适应语音增强  11-13
    2.1.2 听觉掩蔽效应语音增强  13
  2.2 宽动态压缩算法  13-19
    2.2.1 宽动态压缩算法的原理  14-15
    2.2.2 传统的压缩算法  15-16
    2.2.3 宽动态压缩算法  16-18
    2.2.4 实验仿真和结果分析  18-19
  2.3 移频压缩算法  19-22
  2.4 本章小结  22-23
第三章 基于听觉掩蔽效应的语音增强算法  23-40
  3.1 噪声的特性及分类  23
  3.2 语音及人耳的听觉掩蔽特性  23-27
    3.2.1 语音特性  23-24
    3.2.2 人耳的听觉掩蔽特性  24-27
  3.3 基于听觉掩蔽效应和噪声实时估计的语音增强算法  27-32
    3.3.1 参数可调的谱减法  28-29
    3.3.2 掩蔽阈值的计算和感知滤波器  29-31
    3.3.3 算法步骤  31
    3.3.4 实验仿真和结果分析  31-32
  3.4 听觉掩蔽效应语音增强的改进算法  32-39
    3.4.1 改进的听觉掩蔽效应算法  33-35
    3.4.2 语音谱平滑  35-36
    3.4.3 算法步骤  36-37
    3.4.4 实验仿真和结果分析  37-39
  3.5 本章小结  39-40
第四章 基于共振峰估计的宽动态压缩算法  40-49
  4.1 共振峰提取  40-43
    4.1.1 共振峰  40-41
    4.1.2 共振峰的提取  41-43
  4.2 改进的宽动态压缩算法  43-46
    4.2.1 宽动态压缩算法  43-44
    4.2.2 频域增益  44-46
  4.3 算法的步骤  46
  4.4 实验仿真和结果分析  46-48
  4.5 本章小结  48-49
第五章 数字助听器算法的验证  49-60
  5.1 硬件平台SEED—DEC5416  49-50
  5.2 软件整体设计  50-51
  5.3 信号输入输出设计  51-52
  5.4 算法的实现  52-59
    5.4.1 语音分帧处理  52-53
    5.4.2 算法验证  53-58
    5.4.3 算法实现过程中遇到的问题  58-59
  5.5 本章小结  59-60
第六章 总结与展望  60-62
  6.1 全文内容总结  60
  6.2 后续研究方向  60-62
致谢  62-63
参考文献  63-67
附录:作者在攻读硕士学位期间发表的论文  67-68
附录:部分源程序  68-73

相似论文

  1. 基于听觉掩蔽效应的数字助听器关键技术的研究,TN912.3
  2. 数字助听器中语音增强技术的研究,TN912.35
  3. 单通道语音增强算法的研究,TN912.35
  4. 多管阵列定向语音增强系统的研制,TN912.35
  5. 基于听觉侧抑制的滤波算法研究,TN911.72
  6. 嘈杂环境下的麦克风阵列语音增强技术研究,TN912.35
  7. 复杂环境下语音增强方法研究,TN912.35
  8. 基于子空间的语音增强算法研究,TN912.35
  9. 阵列语音增强算法的研究及实现,TP301.6
  10. MELPe语音编码关键技术研究,TN912.3
  11. 基于TMS320C55x DSP的语音增强算法研究,TN912.3
  12. 语音信号增强与分离算法研究,TN912.3
  13. 军用通信电台前置语音增强系统的研究与实现,TN912.3
  14. 船载航行数据记录仪中的驾驶台语音通信增强和压缩处理,U675.7
  15. 基于自适应滤波器的语音增强算法研究及DSP实现,TN912.3
  16. 多媒体语言学习系统中的关键技术研究,TN912.3
  17. 说话人识别相关技术的研究,TN912.3
  18. 噪音环境下的说话人识别,TN912.3
  19. 多通道语音增强与语音盲分离算法的研究,TN912.3
  20. 基于数学形态学的语音识别系统的研究与实现,TN912.34

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法 > 算法理论
© 2012 www.xueweilunwen.com