学位论文 > 优秀研究生学位论文题录展示
汉语普通话基频模式研究
作 者: 潘秀林
导 师: 顾宏斌
学 校: 南京航空航天大学
专 业: 载运工具运用工程
关键词: 文语转换 端点检测 基音检测 基频模式
分类号: TN912.33
类 型: 硕士论文
年 份: 2008年
下 载: 68次
引 用: 1次
阅 读: 论文下载
内容摘要
机务CBT系统是在一定程度上具备智能化的多媒体课件制作平台,它以后台的多媒体数据库为支持,能够使用户按照自己的需求和个人风格来制作出理想的多媒体课件。汉语文语转换系统是其中的一个子系统,它解决的主要问题就是如何将文字信息转化为连续、自然的语音流。在文语转换系统中,韵律模型是衔接文本分析和语音合成的桥梁。好的韵律模型是高自然度语音合成系统中的一个重要组成部分。本文以此为目的,首先回顾了文语转换技术的发展,然后介绍了汉语文语转换技术的相关理论,重点放在连续语音端点检测算法、基音周期估计算法和基频模式的获取。因为声调信息主要存在于单音节的韵母部分,所以研究连续汉语语音的端点检测很有必要。本文通过比较传统端点检测算法,结合语音合成语料库实际需要开发了ManualCutTool语音切分软件。本文研究了时域上的基音检测算法,如:自相关法、平均幅度差法等,并总结以上算法的优缺点提出了基于循环幅度差平方和函数和自相关函数相结合的基音周期估计算法,实验证明利用该算法能有效地提高基频估计和清浊判决的准确率。本文还研究了聚类算法,克服了传统的k均值算法的缺点,选择改进的迭代自组织数据分析方法(ISODATA)进行基频模式的提取。最后本文对整个论文进行了总结,并提出了进一步工作内容。
|
全文目录
摘要 4-5 ABSTRACT 5-13 第一章 绪论 13-19 1.1 引言 13 1.2 研究背景 13-17 1.2.1 文语转换技术的发展历史 13-14 1.2.2 课题研究现状 14-16 1.2.3 文语转换技术的发展前景 16-17 1.2.4 团队研究进展 17 1.3 课题研究内容 17-18 1.4 论文工作安排 18-19 第二章 文语转换技术相关理论 19-32 2.1 语音信号处理 19-25 2.1.1 语音产生机制 19-20 2.1.2 语音信号的数学模型 20-23 2.1.3 语音信号的时域特性 23-24 2.1.4 语音信号的频域特性 24-25 2.2 汉语语音学相关概念 25-28 2.2.1 音素和音节 25-26 2.2.2 语音的物理特性 26-28 2.2.3 汉语韵律 28 2.3 文语转换系统的结构组成 28-32 2.3.1 文本分析 28-29 2.3.2 韵律控制 29-30 2.3.3 语音合成 30-32 第三章 语音库建设及其语音切分 32-43 3.1 引言 32 3.2 语音库建设 32-34 3.2.1 单音节语音库建设和字音检索机制 32-34 3.2.2 有声语料的搜集 34 3.3 端点检测原理 34-39 3.3.1 端点检测概念引入 35 3.3.2 短时能量 35-36 3.3.3 短时平均过零率 36-37 3.3.4 基于短时能量和过零率的双门限检测方法 37-38 3.3.5 基于信息熵的端点检测方法 38-39 3.4 MANUALCUTTOOL 音节切分软件 39-42 3.5 本章小结 42-43 第四章 基频检测 43-56 4.1 引言 43 4.2 影响基频检测结果的因素 43-44 4.3 常用的时域基音检测算法 44-50 4.3.1 自相关法(ACF) 44-48 4.3.2 平均幅度差法(AMDF) 48-50 4.4 基于CSMDSF 和ACF 相结合的基音检测算法 50-54 4.4.1 幅度差平方和函数(SMDSF) 50-51 4.4.2 循环幅度差平方和函数(CSMDSF) 51-52 4.4.3 基于CSMDSF 和ACF 相结合的基音检测算法 52-54 4.5 实验 54-55 4.6 结论 55-56 第五章 基频模式提取 56-67 5.1 引言 56-57 5.2 聚类 57-61 5.2.1 聚类概念引入 57-59 5.2.2 常用的聚类方法 59-61 5.3 基频模式提取 61-65 5.3.1 数据预处理 61-63 5.3.2 聚类分析 63-65 5.4 实验 65-66 5.5 本章小结 66-67 第六章 总结与展望 67-69 6.1 论文总结 67 6.2 工作展望 67-69 致谢 69-70 参考文献 70-73 攻读硕士学位期间的研究成果及发表的学术论文 73
|
相似论文
- 数字助听器中语音增强技术的研究,TN912.35
- 功率谱估计在宽带ADCP信号检测中的研究与应用,TN911.23
- 基于电话信道的声纹识别算法研究,TN912.34
- 基于Windows CE的监室管理系统设计与开发,TP311.52
- 基于改进MFCC的语音识别系统研究及设计,TN912.34
- 语音信号基音周期检测算法研究,TN912.3
- 语音端点检测算法研究及硬件实现,TN912.34
- 基于经验模态分解的语音端点检测算法研究,TN912.3
- 说话人识别中特征参数的提取及优化研究,TN912.34
- 自适应低速率语音编解码研究与实现,TN912.3
- 钢琴校音计算机软件的设计,TP368.1
- 基于SOM网络的语音基频模式提取研究,TN912.3
- 与文本无关的开集说话人识别技术研究,TN912.34
- 基于DSP的语音识别技术的研究,TN912.34
- 移动机器人语音识别系统的研究与实现,TN912.34
- 基于DTW模型的孤立词语音识别算法实现研究,TN912.34
- 基于小波变换的汽车语音特征指令逼近与端点检测方法,TN912.3
- 噪声环境下说话人特征参数提取研究,TN912.3
- 说话人识别系统的研究及DSP实现,TN912.34
- 特定人孤立词语音识别系统的ASIC设计,TN912.34
- 基于滤波器组GSC麦克风阵语音增强方法研究,TN641
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音合成
© 2012 www.xueweilunwen.com
|