学位论文 > 优秀研究生学位论文题录展示

基于仿生模式识别的连续语音关键词识别的研究

作 者: 沈孙园
导 师: 王守觉;曹文明
学 校: 浙江工业大学
专 业: 控制理论与控制工程
关键词: 仿生模式识别 高维空间几何分析 连续语音识别 关键词识别
分类号: TP391.42
类 型: 硕士论文
年 份: 2007年
下 载: 189次
引 用: 2次
阅 读: 论文下载
 

内容摘要


关键词识别连续语音识别研究中的一个重要分支,对这一课题的研究若能取得突破性进展,将大大拓宽语音识别系统的应用领域。本文首先对关键词识别方法进行了综述,对现存的几种典型的方法进行分析,指出传统方法存在的一些难点,如填料模板的提取、算法的复杂度、连续语音端点的检测和切分等。接着从几何学的角度介绍了贯穿全文的仿生模式识别理论,并从集合论中凸集与凸可分的角度,对高维有限子空间和单纯形的关系做了介绍,并得出单纯形可以作为凸包络的基本元素来表述任意形状的有限空间的结论,为我们训练和识别算法的提出奠定了数学基础。在训练建模阶段,我们选择“词”作为基本的识别基元,并提出了一种新的特征提取方法。然后基于仿生模式识别理论直接对特征提取后的关键词样本点建立各个高维空间覆盖区,对非关键词我们无需建模,因而我们的词表可以是开放的。在识别算法上,采用高维空间点覆盖动态搜索的识别算法,该算法无需对被识别的连续语音进行端点检测和切分,直接搜索特征提取后被识别的连续语音各点到各类关键词覆盖区的距离时间曲线上的距离极小值,以此来确定被识别连续语音中有无关键词和有多少关键词。最后通过实验验证了该方法的有效性。

全文目录


摘要  5-7
ABSTRACT  7-11
第一章 绪论  11-27
  1.1 引言  11-13
  1.2 语音识别系统的分类  13-15
  1.3 中小词汇量连续语音关键词识别研究的意义  15-18
    1.3.1 中小词汇量语音识别研究的意义  15-16
    1.3.2 关键词识别研究的重要意义  16-18
  1.4 选题背景  18-24
    1.4.1 关键词识别研究的发展现状  18-20
    1.4.2 传统的关键词识别算法中存在的问题  20-21
    1.4.3 关键词识别的主要技术难点  21-23
    1.4.4 识别系统实用化所面临的问题  23-24
  1.5 本文的解决方法和论文结构  24-26
  1.6 本文的创新点  26-27
第二章 仿生模式识别理论  27-47
  2.1 仿生模式识别的提出  27-28
  2.2 仿生模式识别的基点——特征空间中同类样本全体的连续性规律  28-29
  2.3 仿生模式识别与传统模式识别的区别  29-30
  2.4 仿生模式识别的数学基础——高维空间几何  30-39
    2.4.1 高维空间  31
    2.4.2 高维空间中的有限和无限低维子空间  31-33
    2.4.3 高维空间中的体积  33-36
    2.4.4 单纯形与高维有限空间  36-39
  2.5 仿生模式识别理论的实现手段——多权值神经元人工神经网络  39-46
    2.5.1 神经元的多维空间几何对应  39-42
    2.5.2 不同的覆盖形体对识别效果的影响  42-44
    2.5.3 多权值神经元  44-46
  2.6 小结  46-47
第三章 语音识别的预处理和特征提取  47-67
  3.1 关键词识别系统  47-57
    3.1.1 预处理  47-52
    3.1.2 语音信号的特征提取  52-57
  3.2 语音数据库的构成和一种新的特征提取方法  57-66
    3.2.1 语音数据库的构成和特点  57-59
    3.2.2 关键词样本的提取和MFCC变换  59-62
    3.2.3 压缩  62-63
    3.2.4 规整关键词样本  63-65
    3.2.5 关键词特征的归一化  65-66
  3.3 小结  66-67
第四章 基于仿生模式识别的关键词识别  67-77
  4.1 基于仿生模式识别的关键词识别过程  67-71
    4.1.1 关键词识别的两个阶段  67-68
    4.1.2 基于仿生模式识别的训练和识别算法  68-71
  4.2 关键词识别系统的评价  71-72
  4.3 实验和分析  72-76
    4.3.1 关键词训练及识别样本库的建立  72-73
    4.3.2 实验与结果  73-74
    4.3.3 结果分析  74-76
  4.4 小结  76-77
第五章 结论与展望  77-79
参考文献  79-86
致谢  86-87
攻读学位期间发表的学术论文目录  87

相似论文

  1. 基于仿生模式识别的文本分类技术研究,TP391.1
  2. 基于用户电话号码的传真报筛选检索研究,TP391.3
  3. 基于动态贝叶斯网络的连续语音识别研究,TN912.34
  4. 基于自适应的LVCSR系统半监督学习方法的研究,TN912.34
  5. 仿生模式识别的几何学习理论的研究,TP391.41
  6. 基于网络监听的关键词识别系统的研究与实现,TP391.43
  7. 基于仿生模式识别的文本分类算法研究,TP391.1
  8. 面向连续语音识别的半监督学习方法的研究,TN912.34
  9. ICA/PCA虹膜识别方法中预处理与分类的改进方法研究,TP391.41
  10. 基于仿生模式的虹膜识别研究,TP391.41
  11. 大词表自然语音关键词识别系统的研究与实现,TN912.34
  12. 基于多尺度分析和仿生模式识别的纹理图像识别,TP391.41
  13. 语音关键词识别技术的研究及应用,TP391.42
  14. 基于嵌入式的家电关键词语音识别系统的研究与设计,TN912.34
  15. 基于Sphinx的汉语连续语音识别,TN912.34
  16. 仿生模式识别应用研究,TP18
  17. 小词汇量非特定人连续语音识别系统的研究,TN912.34
  18. 基于GPU的并行人脸识别算法研究,TP391.41
  19. 基于飞行器的连续语音指令识别技术研究,TN912.34
  20. 语音识别技术的研究及其在发音错误识别系统中的应用,TN912.34
  21. 连续语音识别中声学模型的建立,TN912.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 声音识别及其装置
© 2012 www.xueweilunwen.com