学位论文 > 优秀研究生学位论文题录展示

基于SOM网络的语音基频模式提取研究

作 者: 傅雪
导 师: 张少白
学 校: 南京邮电大学
专 业: 计算机应用技术
关键词: 文语转换 基频模式 自组织特征映射网络 聚类
分类号: TN912.3
类 型: 硕士论文
年 份: 2011年
下 载: 13次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着社会的发展,计算机与人们的生活已密不可分,如何才能方便地与计算机进行交流成为人们需要解决的一个重要问题。语言是人类最方便的交流方式,因此人们希望能够采用语言与计算机直接进行交流,也就是实现人机之间真正的语声通讯。作为这一要求的计算机自然语言输出部分,文语转换系统近几年来发展的非常迅速,涌现出了大量的新技术。韵律模型在文语转换系统中是必不可少的。它将文本分析和语音生成联系起来,起着一个重要的桥梁作用。好的韵律模型,使之能够更加贴近自然语言中的各种韵律现象,是高自然度文语转换系统中的重要组成部分。而基频模式的提取是研究韵律规则的基础。因此,本文对如何提取基频模式进行了深入的研究。主要研究成果如下:1.为了获取用于聚类的基频序列,对语音数据进行了一系列的预处理工作,有音节切分、基频标注、长度规整、滑动平均和零均值化等工作。2.研究了两种常用的聚类算法:K均值法和ISODATA法。在此基础上,考虑到SOM网络独特的无监督、自组织和本身具有的聚类功能,提出采用SOM算法作为基频模式提取的聚类算法,克服了其他算法的一些不足之处。3.以一个特定语音库作为实验数据,用SOM算法对预处理后的基频序列聚类,得到15种典型的基频模式,并给出相应的基频曲线。在提取基频模式后,需要通过决策树的方法挖掘出具体的韵律规则,来指导语音的合成。这将是下一步要进行的工作。

全文目录


摘要  4-5
ABSTRACT  5-8
第一章 绪论  8-15
  1.1 引言  8
  1.2 文语转换技术的研究与发展  8-13
    1.2.1 文语转换技术的历史和现状  8-10
    1.2.2 文语转换技术的发展方向  10-12
    1.2.3 基频模型概述  12-13
  1.3 本文研究内容及论文结构  13-15
    1.3.1 本文研究内容  13-14
    1.3.2 论文结构  14-15
第二章 文语转换技术相关理论  15-26
  2.1 语音信号处理  15-19
    2.1.1 发音机制  15-16
    2.1.2 数学产生模型  16-19
  2.2 语音学相关概念  19-22
    2.2.1 语音的组成结构  19-20
    2.2.2 物理特性  20-22
    2.2.3 韵律特征  22
  2.3 文语转换系统的结构  22-25
    2.3.1 文本分析  23-24
    2.3.2 韵律控制  24-25
    2.3.3 语音合成  25
  2.4 本章小结  25-26
第三章 提取基频模式聚类算法  26-39
  3.1 引言  26-27
  3.2 聚类的概念  27
  3.3 相似性度量  27-28
  3.4 主要聚类算法  28-30
  3.5 自组织特征映射网络算法  30-38
    3.5.1 网络模型  30-34
    3.5.2 学习算法  34-36
    3.5.3 仿真实验  36-38
  3.6 本章小结  38-39
第四章 基频模式的提取  39-47
  4.1 实验数据  39
  4.2 预处理技术  39-44
    4.2.1 基频提取  39-40
    4.2.2 音节切分和基频标注  40-41
    4.2.3 长度规整  41-43
    4.2.4 滑动平均  43-44
    4.2.5 零均值化  44
  4.3 实验结果分析  44-45
  4.4 本章小结  45-47
第五章 总结与展望  47-49
  5.1 总结  47
  5.2 展望  47-49
致谢  49-50
参考文献  50-53
攻读硕士期间的研究成果  53

相似论文

  1. 隐式用户兴趣挖掘的研究与实现,TP311.13
  2. 图像分割中阴影去除算法的研究,TP391.41
  3. 基于图分割的文本提取方法研究,TP391.41
  4. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  5. 高血压前期证候特征研究,R259
  6. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  7. K-均值聚类算法的研究与改进,TP311.13
  8. 大学生综合素质测评研究,G645.5
  9. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  10. 21个荷花品种遗传多样性的ISSR分析,S682.32
  11. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  12. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  13. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  14. 南通市农业面源污染负荷研究与综合评价,X592
  15. 土壤环境功能区划研究,X321
  16. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  17. 大豆杂种优势及其遗传基础研究,S565.1
  18. 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
  19. 细菌聚类算法及其在图像分割问题中的研究与应用,TP391.41
  20. 基于变异粒子群的聚类算法研究,TP18
  21. K-means聚类优化算法的研究,TP311.13

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com