学位论文 > 优秀研究生学位论文题录展示
基于VQ模型和BP网络的高自然度语音转换
作 者: 丁耀娥
导 师: 俞一彪
学 校: 苏州大学
专 业: 信号与信息处理
关键词: 语音转换 VQ模型 超音段特征 BP网络
分类号: TN912.3
类 型: 硕士论文
年 份: 2009年
下 载: 120次
引 用: 0次
阅 读: 论文下载
内容摘要
说话人语音转换技术是把源说话人说的语音转换为像是目标说话人所说的语音的技术。说话人语音转换具有广泛的应用领域,比如文语转换(Text一to-Speech, TTS)系统、配音系统和保密通信等。本文提出了一种基于VQ模型与BP网络的高自然度语音转换方法。算法分为三个部分:前两部分用VQ模型实现了语音的谱包络及其激励的转换,第三部分采用BP算法实现语音的韵律转换规则建模。算法针对基音周期内残差波形的特点提出了循环互相关函数,有效地实现了残差波形聚类;针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音转换并得到高自然度合成语音。本文主要工作包括:(1)基于VQ模型实现了语音的谱包络转换。谱包络采用20阶LPC系数转换形成的线谱对频率系数LSF表示。相对于LPC参数,LSF具有更好的内插特性和量化特性。训练分别得到128个源语音的码向量和128个目标语音的码向量和由每一个源语音码向量到目标语音码向量的映射码书,映射码书就为目标语音向量的线性合成时的加权系数。转换后的语音的LSF系数更接近于目标说话人语音的LSF系数。(2)基于VQ模型实现了其激励的转换。对残差的转换分为两阶段,一是残差能量的转换,采用线性转换的方法;二是对残差波形的转换,采用的方法是基于VQ码本映射的模型。在残差波形转换中,定义了循环互相关函数,并以最大互相关值的相反数作为波形间的距离测度。转换后的语音残差信号更多的保留了目标说话人的信息。(3)采用BP算法实现语音的韵律变换规则建模。提取源说话人和目标说话人的相对基频曲线。用三层BP网络进行训练得到映射权值。在变换后的相对基频曲线加上目标语音的平均基频就得到转换后的基频曲线。算法针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音变换并得到高自然度合成语音,实验表明是一种有效的汉语语音转换算法。
|
全文目录
中文摘要 3-4 Abstract 4-9 第一章 绪论 9-12 1.1 语音转换研究的意义 9-10 1.2 语音转换的背景 10 1.3 主要研究内容 10-12 第二章 语音转换技术分析 12-28 2.1 语音信号的基本特性 12-14 2.1.1 语音信号的时域特性 12-14 2.1.2 语音信号的频域特性 14 2.2 语音的产生模型,个人特性及其相关参数 14-17 2.2.1 语音产生模型 14-15 2.2.2 语音的个人特性 15-16 2.2.3 体现声音个人特性的声学特征参数 16-17 2.3 语音转换算法分析 17-27 2.3.1 语音频谱变换 18-23 2.3.2 激励信号处理 23-24 2.3.3 基频信息变换 24-26 2.3.4 语音转换性能评价 26-27 2.4 本章小结 27-28 第三章 基于VQ 算法的谱包络转换 28-40 3.1 谱包络转换中的基本算法 28-35 3.1.1 线性预测 28-31 3.1.2 线谱频率 31-32 3.1.3 矢量量化 32-35 3.2 谱参数的转换 35-39 3.2.1 谱参数的VQ 模型训练 35-38 3.2.2 谱参数转换的实现 38-39 3.3 本章小结 39-40 第四章 基于VQ 算法的残差转换 40-44 4.1 残差转换中的基本算法 40-41 4.1.1 自相关函数的定义和性质 40 4.1.2 短时自相关函数 40-41 4.1.3 变形短时自相关函数 41 4.1.4 循环互相关 41 4.2 残差参数转换 41-43 4.2.1 残差信号的模型训练 41-43 4.2.1.1 残差提取 42 4.2.1.2 训练 42 4.2.1.3 残差能量的训练 42-43 4.2.2 转换的实现 43 4.3 本章小结 43-44 第五章 基于BP 网络的基频曲线转换 44-56 5.1 BP 网络原理 44-52 5.1.1 前馈型神经网络 44 5.1.2 BP 误差反向传播神经网络 44-47 5.1.3 BP 学习算法 47-52 5.2 基频的曲线转换 52-55 5.3 本章小结 55-56 第六章 语音转换实验与分析 56-65 6.1 转换系统处理流程 56-57 6.1.1 训练流程 56-57 6.1.2 转换流程 57 6.2 谱包络、残差和韵律调整实验 57-62 6.2.1 谱包络转换实验 57-59 6.2.2 残差转换实验 59-60 6.2.3 韵律调整实验 60-62 6.3 语音转换实验 62-65 结论 65-67 参考文献 67-71 攻读硕士学位期间公开发表的论文 71-72 缩略语中英文对照表 72-73 致谢 73
|
相似论文
- 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
- 数字图像盲取证技术研究,TP391.41
- 高质量语音转换系统中关键技术的研究,TN912.3
- 基于模型的进气道喷射汽油机空燃比控制的研究,TK417
- 军用直升机齿轮箱状态与使用监控系统研究,V275.1
- 丁家坟滑坡失稳机制及变形预测研究,P642.22
- 非软土地区基坑降水地面沉降预测模型研究,TU433
- 谐振接地电网故障选线智能方法研究,TM862
- 基于DSP的电机转子断条故障的诊断系统,TM307
- 工业35T/H循环流化床锅炉燃烧系统建模与仿真研究,TK223.2
- 机载电源网络测控系统,V242.2
- 局部放电检测系统中的信号去噪与模式识别的研究,TP391.41
- 棉花株顶识别系统的研究,TP391.41
- 基于图像识别技术的豆科牧草分类研究,TP391.41
- 基于脉冲电流法所测GIS局部放电信号的故障识别技术研究,TM595
- 数据挖掘在短期电力负荷预测中的应用研究,TM715
- 全矢谱体系兼容性关键技术研究,TH165.3
- 基于小波变换和遗传神经网络的癫痫智能诊断,TP183
- 结合脑电信息的多自由度肌电假手研究,R49
- 基于GA-BP和结构特征的电表读数识别,TP391.41
- 改进BP神经网络在水质评价中的应用研究,TP183
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|