学位论文 > 优秀研究生学位论文题录展示

说话人识别控制器的研究与实现

作 者: 陈伟峰
导 师: 张歆奕
学 校: 五邑大学
专 业: 信号与信息处理
关键词: 说话人识别 语音信号 变动性 特征的提取 One-Pass动态时间规整 单片机
分类号: TN912.34
类 型: 硕士论文
年 份: 2008年
下 载: 63次
引 用: 0次
阅 读: 论文下载
 

内容摘要


说话人识别技术属于生物识别技术的范畴,是指从说话人的语音中提取特征,通过科学计算的方法来识别说话者,利用语音进行身份辨认以确认对象是否具合法进入保安、保密系统等是说话人识别的重要应用之一。通过语音输入密码的方式辨别说话人能弥补传统的按键输入密码方式的易被盗性,易遗忘性等缺点。另一方面,说话者本身的生理变动性以及说话习惯变动性,常造成识别系统性能的下降。本文在研究说话人识别系统中的各种特征参数和识别方法的基础上,着重研究了线性预测倒谱系数(LPCC)、能够适应说话者生理及说话习惯变动性的动态时间规整算法,即One-Pass DTW算法,并在凌阳16位单片机SPCE061A上实现基于LPCC与One-Pass DTW的说话人确认系统。本文的主要工作如下:1.介绍了语音信号的预处理,包括预滤波、预加重、分帧与加窗和端点检测。2.介绍了人声产生的原理与数字模型,并研究了常用的语音特征线性预测倒谱系数(LPCC)和美尔倒谱系数(MFCC)的原理及提取方法。3.研究了说话人识别的基本方法,着重介绍了动态时间规整算法(DynamicTime Warping),并深入研究与分析了One-Pass DTW算法。4.讨论了在凌阳16位单片机SPCE061A上实现了说话人识别系统的若干问题,并在该平台上实现了说话人确认系统。

全文目录


摘要  4-5
ABSTRACT  5-6
目录  6-8
第一章 绪论  8-12
  1.1 生物技术识别  8
  1.2 说话人识别技术的基本概念  8-9
  1.3 国内外研究动态及选题意义  9-10
  1.4 本论文的主要工作及论文的内容安排  10-12
第二章 语音信号预处理  12-18
  2.1 预滤波  12-13
  2.2 预加重  13-14
  2.3 分帧与加窗  14-16
  2.4 端点检测  16-17
    2.4.1 短时能量  16
    2.4.2 短时过零率  16-17
  2.5 本章小结  17-18
第三章 说话人特征参数的提取  18-28
  3.1 语音信号产生的数学模型  18-20
    3.1.1 发声器官  18-19
    3.1.2 语音信号的产生的数学模型  19-20
  3.2 线性预测倒谱系数(LPCC)  20-25
    3.2.1 语音信号的线性预测系数(LPC)  20-23
    3.2.2 同态处理和LPC倒谱系数  23-25
  3.3 美尔倒谱系数(MFCC)  25-26
  3.4 本章小结  26-28
第四章 说话人识别方法  28-43
  4.1 说话人识别方法简介  28-30
  4.2 DTW算法原理  30-32
  4.3 ONE-PASS DTW  32-39
    4.3.1 One-Pass DTW算法基本原理  32-34
    4.3.2 One-Pass DTW语法介绍  34-36
    4.3.3 增加静音模板的One-Pass DTW  36-39
  4.4 基于ONE-PASS DTW的说话人识别系统  39-42
    4.4.1 说话人识别系统  39-40
    4.4.2 系统实验数据与分析  40-42
  4.5 本章小结  42-43
第五章 基于凌阳16单片机SPCE061A的说话人确认系统  43-57
  5.1 凌阳16位单片机SPCE061A简介  43-44
  5.2 基于SPCE061A的说话人确认系统的若干问题讨论  44-51
    5.2.1 One-Pass DTW算法程序实现流程  44-46
    5.2.2 减少One-Pass DTW存储量的方法  46-48
    5.2.3 利用内积运算指令提高LPCC提取速度和端点检测的速度  48-50
    5.2.4 SD卡扩展储存  50-51
  5.3 说话人确认系统  51-56
    5.3.1 说话人确认系统硬件组成  51-52
    5.3.2 说话人确认系统功能组成  52
    5.3.3 说话人确认系统的软件组成  52-55
    5.3.4 系统实验数据与分析  55-56
  5.4 本章小结  56-57
总结与展望  57-58
参考文献  58-60
攻读硕士学位期间发表的学术论文  60-61
致谢  61

相似论文

  1. 转轴径向跳动和转速实时检测光电系统的研究,TH822
  2. 基于小波变换的语音信号去噪及其DSP算法实现,TN912.3
  3. 基于红外吸收原理的甲烷浓度检测仪,TP216
  4. 温室空气源热泵供热系统研究,S625
  5. 基于单片机和LabVIEW的静电除尘系统,X701.2
  6. 片状农业物料滚筒干燥控制系统研究,S226.6
  7. 基于回波包络的超声波入侵探测在军队警戒巡逻中的应用,E919
  8. 单片机AVR运用开发,TP368.12
  9. 矿用电动机软起动器实验装置设计,TM343.2
  10. CAN总线技术在气象监测系统中的应用研究与实现,P409
  11. 基于GPRS的无线数据采集与传输系统设计,TP274.2
  12. 无刷直流电动机及其控制系统,TM33
  13. 基于CAN总线的医疗呼叫系统设计与实现,TN99
  14. 高精度电子天平的温度补偿与自动校准,TP274
  15. 基于DSP和单片机的可调参数心电信号发生器的设计,TP368.12
  16. SUPMAX800D系统HART通信卡的研究与设计,TP273.5
  17. 谷物脂肪酸值自动测定仪的研究与设计,TS210.7
  18. 基于Freescale MC9S12系列单片机开发板的设计,TP368.1
  19. 移动基站状态远程数据监测系统的设计与实现,TP274
  20. 面向三维CAPP的制造特征提取与工艺过程设计的研究,TP391.72
  21. 基于STM32的污水处理pH值控制系统的设计,TP273

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com