学位论文 > 优秀研究生学位论文题录展示

语音关键词检出技术及置信度问题研究

作 者: 梁栋
导 师: 黄荷姣
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 关键词检出 词图 支持向量机 置信度
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 57次
引 用: 0次
阅 读: 论文下载
 

内容摘要


信息时代的到来,使得计算机成为人类生活中重要的工具,为了更加友好地实现人机交互,让计算机也能“听懂”人类的语言,语音识别技术便应运而生。语音关键词检出技术是语音识别的一个重要研究领域,它是从连续的、无限制的自然语音流中识别出一组给定词的语音识别技术。关键词检出技术可以应用于一些具有特定要求的场合,同时具有速度快、高检出率和实用性强等特点,所以具有广阔的应用前景和很好的研究价值。同时,为了提高识别系统的整体性能,对识别结果的确认也是非常重要的,因此有关语音置信度方面的研究也就尤其必要。本文主要对关键词检出技术及置信度问题进行了研究,具体的内容和贡献主要有以下两个方面:(1)介绍了关键词检出技术的过程和原理,提出了一种新的检索算法即Lattice-T算法,该算法是基于词图(Lattice)结构进行的检出算法,把需要检出的关键词用树来存储,通过词图上的节点反过来检索树上的关键词,这样遍历一遍图就可以完成检索任务。相比于传统的基于N-Best结构的关键词检出方法,该方法检出率提高了12.22%,检出的时间效率提高了11.58%,性能得到了提高。(2)介绍了支持向量机(SVM)的相关知识,并利用SVM来求解置信度,讨论了此方法需要解决的一些问题:SVM概率化输出问题、SVM置信度综合问题等。通过和算术平均方法来进行置信度综合的效果相比较,利用SVM得到的置信度,在相同拒识率情况下得到更高的识别率,较算术平均方法在每个拒识率下识别率有大约7%的提高,识别的整体性能增强。本文构建了一个基于中国电信114服务中心电话录音的关键词检出系统,该系统包括关键词检索模块、搜索结果查看功能模块、提交查询结果功能模块、并行检索模块、报表生成模块等。通过对这些模块的介绍和实现效果展示,可以更加直观地了解到关键词检出技术的实际应用。

全文目录


摘要  4-5
Abstract  5-10
第1章 绪论  10-18
  1.1 课题来源  10
  1.2 课题背景  10-14
    1.2.1 语音识别  10-11
    1.2.2 关键词检出技术  11-12
    1.2.3 置信度研究  12-14
  1.3 国内外研究现状  14-17
    1.3.1 语音识别发展  14-15
    1.3.2 关键词检出技术  15-16
    1.3.3 置信度问题的研究现状  16-17
  1.4 本文的内容和组织安  17-18
第2章 关键词检出及其置信度相关技术  18-33
  2.1 关键词检出的相关技术  18-25
    2.1.1 语音识别的预处理  18
    2.1.2 特征提取  18-19
    2.1.3 声学模型训练  19-20
    2.1.4 语言模型训练  20-21
    2.1.5 解码  21-22
    2.1.6 关键词检出的过程  22-23
    2.1.7 关键词检出系统的评价方法  23-25
  2.2 置信度研究相关技术  25-32
    2.2.1 置信度定义  25-26
      2.2.1.1 假设检验  26
      2.2.1.2 模式识别  26
    2.2.2 主要研究内容  26-30
      2.2.2.1 基于后验概率的估值方法  27-28
      2.2.2.2 基于特征分类器的置信度估值方法  28-29
      2.2.2.3 基于语音确认的置信度计算方法  29-30
    2.2.3 置信度信息源综合  30
    2.2.4 评价方法  30-32
  2.3 本章小结  32-33
第3章 关键词检出技术及其实现方法  33-44
  3.1 关键词检出技术的一般过程  33
  3.2 关键词检出的实现  33-39
    3.2.1 N-Best 词格  34-35
    3.2.2 词图(lattice)  35-37
    3.2.3 Trie 树  37-38
    3.2.4 Lattice-T 算法  38-39
  3.3 两种算法的实验结果比较  39-42
    3.3.1 实验环境  39
    3.3.2 实验所用语料  39
    3.3.3 实验结果及其分析  39-42
  3.4 算法在实际系统中的应用  42-43
  3.5 本章总结  43-44
第4章 置信度技术的实现方法  44-56
  4.1 支持向量机(SVM)  44-47
    4.1.1 线性可分情况  44-45
    4.1.2 线性不可分情况  45-46
    4.1.3 核函数  46
    4.1.4 支持向量机的构造  46-47
  4.2 SVM 求解置信度需要解决的一些问题  47-51
    4.2.1 SVM 置信度合成问题  47-50
    4.2.2 SVM 概率化输出问题  50-51
  4.3 实验及其结果分析  51-55
    4.3.1 实验环境  51
    4.3.2 实验所用语料  51
    4.3.3 实验流程  51-52
    4.3.4 实验结果及其分析  52-55
  4.4 本章小结  55-56
第5章 系统的整体实现  56-63
  5.1 引言  56
  5.2 运行环境  56
  5.3 系统简介  56
  5.4 系统各模块功能介绍  56-62
    5.4.1 系统的整体实现效果  56-57
    5.4.2 关键词检索模块  57-58
    5.4.3 搜索结果查看功能  58-59
    5.4.4 提交查询结果功能  59-60
    5.4.5 并行检索功能  60
    5.4.6 报表生成功能  60-62
  5.5 本章小结  62-63
结论  63-64
参考文献  64-69
致谢  69

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  10. 基于图像的路面破损识别,TP391.41
  11. 基于支持向量机的故障诊断方法研究,TP18
  12. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  13. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  14. 基于车载3D加速传感器的路况监测研究,TP274
  15. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  16. 基于机器学习的入侵检测系统研究,TP393.08
  17. 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
  18. 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
  19. 基于AdaBoost算法的人脸识别研究,TP391.41
  20. 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
  21. 城市污水处理厂中A~2O工艺过程的建模研究,X703

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com