学位论文 > 优秀研究生学位论文题录展示
语音关键词检出技术及置信度问题研究
作 者: 梁栋
导 师: 黄荷姣
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 关键词检出 词图 支持向量机 置信度
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 57次
引 用: 0次
阅 读: 论文下载
内容摘要
信息时代的到来,使得计算机成为人类生活中重要的工具,为了更加友好地实现人机交互,让计算机也能“听懂”人类的语言,语音识别技术便应运而生。语音关键词检出技术是语音识别的一个重要研究领域,它是从连续的、无限制的自然语音流中识别出一组给定词的语音识别技术。关键词检出技术可以应用于一些具有特定要求的场合,同时具有速度快、高检出率和实用性强等特点,所以具有广阔的应用前景和很好的研究价值。同时,为了提高识别系统的整体性能,对识别结果的确认也是非常重要的,因此有关语音置信度方面的研究也就尤其必要。本文主要对关键词检出技术及置信度问题进行了研究,具体的内容和贡献主要有以下两个方面:(1)介绍了关键词检出技术的过程和原理,提出了一种新的检索算法即Lattice-T算法,该算法是基于词图(Lattice)结构进行的检出算法,把需要检出的关键词用树来存储,通过词图上的节点反过来检索树上的关键词,这样遍历一遍图就可以完成检索任务。相比于传统的基于N-Best结构的关键词检出方法,该方法检出率提高了12.22%,检出的时间效率提高了11.58%,性能得到了提高。(2)介绍了支持向量机(SVM)的相关知识,并利用SVM来求解置信度,讨论了此方法需要解决的一些问题:SVM概率化输出问题、SVM置信度综合问题等。通过和算术平均方法来进行置信度综合的效果相比较,利用SVM得到的置信度,在相同拒识率情况下得到更高的识别率,较算术平均方法在每个拒识率下识别率有大约7%的提高,识别的整体性能增强。本文构建了一个基于中国电信114服务中心电话录音的关键词检出系统,该系统包括关键词检索模块、搜索结果查看功能模块、提交查询结果功能模块、并行检索模块、报表生成模块等。通过对这些模块的介绍和实现效果展示,可以更加直观地了解到关键词检出技术的实际应用。
|
全文目录
摘要 4-5 Abstract 5-10 第1章 绪论 10-18 1.1 课题来源 10 1.2 课题背景 10-14 1.2.1 语音识别 10-11 1.2.2 关键词检出技术 11-12 1.2.3 置信度研究 12-14 1.3 国内外研究现状 14-17 1.3.1 语音识别发展 14-15 1.3.2 关键词检出技术 15-16 1.3.3 置信度问题的研究现状 16-17 1.4 本文的内容和组织安 17-18 第2章 关键词检出及其置信度相关技术 18-33 2.1 关键词检出的相关技术 18-25 2.1.1 语音识别的预处理 18 2.1.2 特征提取 18-19 2.1.3 声学模型训练 19-20 2.1.4 语言模型训练 20-21 2.1.5 解码 21-22 2.1.6 关键词检出的过程 22-23 2.1.7 关键词检出系统的评价方法 23-25 2.2 置信度研究相关技术 25-32 2.2.1 置信度定义 25-26 2.2.1.1 假设检验 26 2.2.1.2 模式识别 26 2.2.2 主要研究内容 26-30 2.2.2.1 基于后验概率的估值方法 27-28 2.2.2.2 基于特征分类器的置信度估值方法 28-29 2.2.2.3 基于语音确认的置信度计算方法 29-30 2.2.3 置信度信息源综合 30 2.2.4 评价方法 30-32 2.3 本章小结 32-33 第3章 关键词检出技术及其实现方法 33-44 3.1 关键词检出技术的一般过程 33 3.2 关键词检出的实现 33-39 3.2.1 N-Best 词格 34-35 3.2.2 词图(lattice) 35-37 3.2.3 Trie 树 37-38 3.2.4 Lattice-T 算法 38-39 3.3 两种算法的实验结果比较 39-42 3.3.1 实验环境 39 3.3.2 实验所用语料 39 3.3.3 实验结果及其分析 39-42 3.4 算法在实际系统中的应用 42-43 3.5 本章总结 43-44 第4章 置信度技术的实现方法 44-56 4.1 支持向量机(SVM) 44-47 4.1.1 线性可分情况 44-45 4.1.2 线性不可分情况 45-46 4.1.3 核函数 46 4.1.4 支持向量机的构造 46-47 4.2 SVM 求解置信度需要解决的一些问题 47-51 4.2.1 SVM 置信度合成问题 47-50 4.2.2 SVM 概率化输出问题 50-51 4.3 实验及其结果分析 51-55 4.3.1 实验环境 51 4.3.2 实验所用语料 51 4.3.3 实验流程 51-52 4.3.4 实验结果及其分析 52-55 4.4 本章小结 55-56 第5章 系统的整体实现 56-63 5.1 引言 56 5.2 运行环境 56 5.3 系统简介 56 5.4 系统各模块功能介绍 56-62 5.4.1 系统的整体实现效果 56-57 5.4.2 关键词检索模块 57-58 5.4.3 搜索结果查看功能 58-59 5.4.4 提交查询结果功能 59-60 5.4.5 并行检索功能 60 5.4.6 报表生成功能 60-62 5.5 本章小结 62-63 结论 63-64 参考文献 64-69 致谢 69
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于机器学习的入侵检测系统研究,TP393.08
- 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
- 基于AdaBoost算法的人脸识别研究,TP391.41
- 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
- 城市污水处理厂中A~2O工艺过程的建模研究,X703
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|