学位论文 > 优秀研究生学位论文题录展示

语音端点检测算法研究及硬件实现

作 者: 周明忠
导 师: 吉立新
学 校: 解放军信息工程大学
专 业: 通信与信息系统
关键词: 端点检测 VAD FPGA 硬件实现 谱熵 加权过零率
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 122次
引 用: 0次
阅 读: 论文下载
 

内容摘要


在语音信号处理中,利用语音的某种特性将有话部分和无话部分区分出来,称为语音端点检测。准确的语音端点检测将提高信道的利用率和减少语音处理的数据量。早期的端点检测算法有基于短时能量和过零率、倒谱距离、谱熵检测等。但是这些方法难以在识别性能和处理速度方面达到平衡。随着通信和信息技术的迅速发展,在信息安全防护领域中对电话信道语音处理的应用正在不断扩展和深化,为了解决不断增长的海量语音数据,产生了大容量实时语音处理系统的需求。本课题旨在解决大规模环境下多路电话信道语音实时端点检测的难题。论文针对大容量实时语音处理系统中端点检测的设计实现展开研究,研究主要内容包括:1、针对经典双门限检测抗噪性能不强的缺点,提出EWZCD算法。改进后的算法抗噪性能有了很大提高,能够满足信噪比较高的电话信道语音检测需求。2、基于时域能零积和频域谱熵分级检测的思想,提出EZV-EGD算法。针对部分线路上语音信噪比较低的实际,引入谱熵进行分级检测,将算法在时域和频域逐级进行收敛。算法的主要思想是,用时域能零积对语音信号进行一级判决,检测出部分确定的语音和噪声;再用频域谱熵对一级处理后的疑似语音的帧进行二级判决。实验仿真结果显示,改进后的算法能在低信噪比的环境下实时准确地检测出语音信号。3、提出基于FPGA+DSP架构的硬件设计方案,重点研究了PCB设计过程中的布局布线和电源处理等难点问题,最终设计实现了语音处理硬件平台,并基于该平台将改进型端点检测算法在FPGA上实现。总之,课题目的是要完成能在电话网中大规模应用的多路电话信道语音实时端点检测系统,所以大规模实现、多路、实时和精确检测是必须解决的主要问题。实现的最终验证结果表明,EWZCD算法能够满足信噪比较高的电话链路的实时检测需求,EZV-EGD算法能对信噪比较低的电话链路进行实时精确检测。根据话路语音特征,采取对算法的灵活调用,满足了实际电话信道语音实时、多路、大规模实现和精确检测的需求。

全文目录


摘要  9-10
ABSTRACT  10-12
第一章 绪论  12-18
  1.1 课题研究背景及意义  12-14
    1.1.1 课题研究背景  12-13
    1.1.2 端点检测的意义  13-14
  1.2 端点检测的研究现状  14-15
  1.3 本文主要工作及论文组织结构  15-18
    1.3.1 本文主要工作  15-16
    1.3.2 论文组织结构  16-18
第二章 端点检测算法研究  18-28
  2.1 语音特征参数简介  18-20
    2.1.1 短时平均能量  18-19
    2.1.2 短时平均幅度  19
    2.1.3 短时平均过零率  19-20
    2.1.4 语音信息熵  20
  2.2 端点检测算法  20-24
    2.2.1 时域能量和过零率检测算法  21-23
    2.2.2 频域谱熵检测算法  23-24
  2.3 算法改进方向  24-27
    2.3.1 基于能量和过零率检测的改进策略  24-26
    2.3.2 基于熵检测的改进策略  26-27
  2.4 本章小结  27-28
第三章 改进型端点检测算法设计与仿真分析  28-42
  3.1 基于短时能量和加权过零率检测(EWZCD)算法  28-32
    3.1.1 算法描述  28-30
    3.1.2 算法检测流程  30-32
  3.2 基于能零积和谱熵的分级检测(EZV-EGD)算法  32-37
    3.2.1 算法描述  32-35
    3.2.2 算法检测流程  35-37
  3.3 实验结果与仿真分析  37-41
    3.3.1 实验结果分析  37-39
    3.3.2 不同信噪比下算法性能分析  39-41
  3.4 本章小结  41-42
第四章 语音端点检测硬件设计与实现  42-61
  4.1 语音识别系统硬件平台设计  42-47
    4.1.1 方案设计  42
    4.1.2 系统的PCB设计  42-46
    4.1.3 FPGA在设计中实现的功能  46
    4.1.4 XC5VLX110的配置  46-47
  4.2 基于Xilinx ISE的FPGA开发  47-49
    4.2.1 FPGA技术简介  47-48
    4.2.2 FPGA开发流程  48-49
  4.3 EWZCD算法的FPGA实现  49-54
    4.3.1 算法功能实现  50
    4.3.2 功能模块FPGA实现  50-54
    4.3.3 算法功能仿真  54
  4.4 EZV-EGD算法的FPGA实现  54-60
    4.4.1 算法功能实现  54-55
    4.4.2 功能模块FPGA实现  55-60
    4.4.3 算法功能仿真  60
  4.5 本章小结  60-61
第五章 端点检测算法性能验证  61-65
  5.1 测试平台的建立  61
  5.2 系统测试与性能分析  61-63
  5.3 检测精度结果验证  63
  5.4 算法实现资源占用情况对比  63-64
  5.5 算法检测实时性验证  64
  5.6 本章小结  64-65
结束语  65-66
参考文献  66-69
作者简历 攻读硕士学位期间完成的主要工作  69-70
致谢  70

相似论文

  1. 基于FPGA的电磁超声检测系统的研究,TH878.2
  2. 基于FPGA的五相PMSM驱动控制系统的研究,TM341
  3. LXI任意波形发生器研制,TM935
  4. 基于FPGA的射频功放数字预失真器设计,TN722.75
  5. 突发OFDM系统同步与信道估计算法及FPGA实现,TN919.3
  6. 直扩系统抗多径性能分析及补偿方法研究,TN914.42
  7. 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
  8. 低轨卫星移动信道特性模拟硬件实现,TN927.23
  9. 基于FPGA的多用户扩频码捕获研究及硬件仿真,TN914.42
  10. 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
  11. 基于FPGA的高速图像预处理技术的研究,TP391.41
  12. 基于FPGA的高速数字图像采集与接口设计,TP274.2
  13. 基于FPGA的电感传感器数据采集系统的研制,TP274.2
  14. 基于Nios的串行总线分析仪研制,TP274
  15. 基于FPGA-RocketIO_X的PMC高速数据传输板开发,TP274.2
  16. PXI高性能数字I/O模块研制,TP274
  17. LXI计数器研制,TP274
  18. 基于FPGA的高速实时数据采集系统,TP274.2
  19. 基于Nios Ⅱ的GPS信息接收系统设计,TN967.1
  20. 温压炸药爆炸温度场存储测试技术研究,TQ560.7
  21. 掺铒光纤放大器中泵浦激光器驱动源的研究应用,TN248

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com