学位论文 > 优秀研究生学位论文题录展示
咳嗽自动分类技术研究
作 者: 李文
导 师: 方昌始;田联房
学 校: 华南理工大学
专 业: 控制理论与控制工程
关键词: 咳嗽分类 特征提取 Mel频率倒谱系数(MFCC) 动态时间规整(DTW)
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 50次
引 用: 2次
阅 读: 论文下载
内容摘要
咳嗽是一种广泛存在于临床的症状之一,它是由气道的突发性呼气产生的一种保护机制。根据不同的病因,咳嗽音的特点有着很大的区别,分析病人的咳嗽音类型对于诊断病人的病因在临床医学上具有极大价值。为了摆脱人工分类的复杂性、繁琐性和差异性等弊端,本文对咳嗽音的自动分类技术进行了深入的研究。咳嗽类型有多种不同的分类方式,本文使用常见的干湿性的分类方式,经过分析发现采用合适的分类方法可以突出干湿性咳嗽的差异,从而易于提供较准确的分类结果。另一方面干湿性的区分具有较大的医学诊断价值。本文对国内外目前在语音识别和咳嗽识别等相关领域内的研究现状进行了概要的阐述,基于咳嗽机理的特点并提出了一种基于MFCC和DTW模板匹配技术的咳嗽分类系统。本文经过对咳嗽和语音的特点分析,发现基于声道模型的LPCC并不适合用于咳嗽分类,因此采用基于听觉特性的MFCC特征参数。为了改善参数动态性能,对MFCC进行二次特征处理,追加了标准MFCC的一阶差分。同时考虑到模板训练和咳嗽分类环境噪声不一致可能导致的系统性能下降,本文提出了一种改进的带噪声抑制的MFCC特征参数,从而提高了系统的鲁棒性。在模板匹配单位,使用DTW作为匹配算法以适应咳嗽这种孤立且持续时间差异性较大的声音片段,并将松弛起止点技术引入DTW算法以减少对端点检测结果的敏感性。同时,本文还使用改进的K均值算法来对样本进行自动化的模板库训练以最大限度的减少人工干预并确保模板库的稳定性。通过多项实验,结果表明本文所使用的技术和改进算法用于咳嗽自动分类取得了良好的分类效果。最后,本文还开发了一套基于上述算法的软件系统,方便了医院方面的使用和测试,为咳嗽自动分类系统进入实验测试阶段提供了帮助。
|
全文目录
摘要 6-7 Abstract 7-11 第1章 绪论 11-15 1.1 研究背景与研究意义 11 1.2 咳嗽音分析技术的研究现状 11-13 1.2.1 语音识别研究历史及其发展 11-12 1.2.2 国内外咳嗽音分析研究现状 12-13 1.3 本文的研究内容 13-15 1.3.1 研究内容与研究目标 13 1.3.2 论文结构安排 13-15 第2章 咳嗽分类系统框架与咳嗽机理分析 15-29 2.1 系统需求 15-16 2.2 咳嗽分类系统框架与算法要点 16-17 2.3 语音信号 17-21 2.3.1 语音产生机理 17-18 2.3.2 语音的声学特征 18-19 2.3.3 语音产生的离散系统模型 19-21 2.4 咳嗽产生机理及其特征分析 21-26 2.4.1 咳嗽的产生机理 21-22 2.4.2 咳嗽的类型 22 2.4.3 咳嗽音的特征分析 22-26 2.5 人耳听觉特性 26-28 2.6 本章小结 28-29 第3章 咳嗽音特征参数提取 29-39 3.1 短时分析技术 29-30 3.2 线性预测倒谱系数LPCC 30-32 3.3 Mel 频率倒谱系数MFCC 32-35 3.3.1 MFCC 参数的提取 32-34 3.3.2 差分MFCC 参数的提取 34-35 3.4 感知线性预测PLP 35-36 3.5 噪声抑制技术 36-38 3.5.1 RASTA 技术 36-37 3.5.2 带噪声抑制的MFCC 37-38 3.6 本章小结 38-39 第4章 咳嗽自动分类方法与原理 39-47 4.1 动态时间规整DTW 39-46 4.1.1 DTW 基本原理 39-42 4.1.2 模板训练方法 42-46 4.2 本章小结 46-47 第5章 咳嗽音分析软件系统的设计与实现 47-61 5.1 系统总体设计 47-49 5.1.1 系统设计目标 47 5.1.2 系统整体设计方案 47-49 5.2 系统前端各功能模块详细设计 49-53 5.2.1 数据读取与管理模块 49-51 5.2.2 音频播放控制模块 51-52 5.2.3 波形图绘制模块 52 5.2.4 程序配置与字符串资源管理模块 52-53 5.3 系统核心算法中的设计模式 53-57 5.4 关键技术实现 57-60 5.4.1 大文件的数据读取 57-58 5.4.2 预处理技术 58-59 5.4.3 双缓存绘图技术 59-60 5.5 本章小结 60-61 第6章 实验结果与分析 61-67 6.1 实验过程与方法 61-62 6.1.1 信号的采集 61 6.1.2 样本库的构成 61 6.1.3 实验方法与过程 61-62 6.2 实验结果与分析 62-65 6.2.1 各种特征参数分类结果对比 62-63 6.2.2 噪声抑制技术对分类结果的影响 63-64 6.2.3 DTW 中的参数对分类结果的影响 64-65 6.3 本章小结 65-67 结论与探讨 67-69 参考文献 69-73 攻读硕士学位期间取得的研究成果 73-75 致谢 75
|
相似论文
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 空间交会接近视觉测量方法研究,TP391.41
- 图像实时采集、存储与处理方法研究,TP391.41
- 唇读中的特征提取、选择与融合,TP391.41
- 多币种纸币处理技术的研究与实现,TP391.41
- 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 移动机器人视觉检测和跟踪研究,TP242.62
- 高光谱与高空间分辨率遥感图像融合算法研究,TP751
- 基于随机森林的植物抗性基因识别方法研究,Q943
- 基于图像处理技术的烟叶病害自动识别研究,S435.72
- 基于视觉的番木瓜外观品质检测技术研究,S667.9
- 羊绒与羊毛纤维鉴别系统的研究,TS101.921
- 红外图像目标识别及跟踪技术研究,TP391.41
- 水下目标特征的压缩与融合技术研究,TN911.7
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|