学位论文 > 优秀研究生学位论文题录展示
藏语安多话音色转换技术研究及其实现
作 者: 张高杰
导 师: 于洪志
学 校: 西北民族大学
专 业: 计算机应用技术
关键词: 藏语安多话 语音音色转换 特征参数 转换系统 主观评测
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 16次
引 用: 0次
阅 读: 论文下载
内容摘要
本论文主要完成三个方面的研究目标:分析安多藏语方言的音色;建立安多藏语方言的音色模型;实现安多藏语方言的音色转换系统。为实现以上研究目标,论文主要工作从文本和语音出发,完成了以下研究内容:1.研究了面向音色转换的安多藏语方言语料库设计问题,建立研究基础。为了后续工作的展开,首先需要解决面向音色转换的语料设计问题,文本语料需要覆盖安多藏语方言不同的声韵母组合,并能代表发音人的韵律特征。设计好文本语料后,录制相应的语音语料,并进行切分标注。2.分析时域、频域的声学特征。音色反映的是说话人的个性特征,在声学特征上反映为时域的韵律特征(如基频、时长、能量、停顿等)和频域的频谱特征(如频谱质心、频谱斜率、共振峰频率等)。通过分析不同音色声学特征上的差异,找到了能够反映藏语安多话音色转换的关键声学特征。3.在研究声学特征参数及提取方法的基础上来建立安多藏语方言语音的音色模型,完成安多藏语方言的音色转换算法。安多藏语的字对应为音节,但其声韵母与汉语不同,且音节无声调。在藏语安多话音色转换算法中,需要充分考察安多藏语方言的音节结构,根据音节结构的特点建立模型。4.实现安多藏语方言的音色转换系统。在该系统实现过程中STRAIGHT算法是关键,利用高质量的语音分析/合成算法STRAIGHT算法为基础并加以改进来完成藏语安多话语音音色转换系统,完成程序设计程序说明和系统性能分析,对其计算复杂度进行评测,并采用主观评测法(ABX测试、MOS测试等)对转换结果进行评测。
|
全文目录
摘要 4-5 ABSTRACT 5-10 第一章 综述 10-15 1.1 与语音音色转换相关的概念 10-11 1.1.1 音色的认识 10 1.1.2 语音音色转换 10-11 1.2 选题背景及意义 11-12 1.2.1 研究背景 11 1.2.2 研究意义 11-12 1.3 藏语安多话音色变换算法技术路线及体系结构 12-13 1.4 藏语音色变换算法的研究现状 13-14 1.5 论文主要工作 14-15 第二章 面向音色转换的安多藏语方言语料库建设 15-23 2.1 安多藏语方言概述 15-16 2.2 语料资源 16-17 2.2.1 收集的藏语单词 17 2.2.2 安多藏语音节分布表 17 2.3 安多藏语语音特征分析 17-19 2.3.1 安多藏语元音声学特征 17-18 2.3.2 安多藏语辅音声学特征 18-19 2.4 藏语安多话语音语料库的选取 19-20 2.4.1 简单句 19 2.4.2 复合句 19-20 2.5 藏语安多话语音库的录音和采集数据 20-23 2.5.1 录音规范及操作流程 20 2.5.2 发音人和监听人的挑选 20-21 2.5.3 录音环境及设备 21-23 第三章 藏语安多话声学特征参数及提取方法 23-35 3.1 藏语安多话语音声学特征参数 23-26 3.1.1 时域声学参数 23-24 3.1.2 频域声学参数 24-26 3.1.3 各声学参数对语音个性特征的贡献 26 3.2 声学特征参数提取方法介绍 26-33 3.2.1 LPC 倒谱系数(LPCC) 27-29 3.2.2 Mel 频率倒谱系数(MFCC) 29-31 3.2.3 加权Mel 倒谱系数 31-33 3.3 藏语安多话语音声学特征提取的具体问题 33-34 3.4 本章 小结 34-35 第四章 安多藏语方言语音的音色模型 35-44 4.1 安多藏语声母中的清浊音 35-38 4.2 藏语安多话语音的音色模型 38-41 4.2.1 浊音模型 38-40 4.2.2 清音模型 40-41 4.3 实验 41-43 4.3.1 实验结果 41-42 4.3.2 主观评价 42-43 4.4 本章 小结 43-44 第五章 藏语安多话语音音色转换算法 44-58 5.1 Straight 算法的理解 44-46 5.1.1 去除周期影响的谱估计 44 5.1.2 平滑可靠的基频轨迹的提取 44 5.1.3 合成端的实现 44-45 5.1.4 求共振峰频率和移动共振峰算法 45-46 5.2 共振峰提取 46-48 5.2.1 Straight 原先的共振峰提取算法 46 5.2.2 改进后算法 46-48 5.3 修改共振峰 48-52 5.3.1 STRAIGHT 算法对共振峰的修改 48-49 5.3.2 对STRAIGHT 算法中修改共振峰方法的改进 49-51 5.3.3 修改共振峰特征算法的公式推导 51-52 5.4 算法流程图 52 5.5 非线性修改共振峰算法 52-54 5.5.1 修改共振峰频率 53 5.5.2 修改共振峰能量 53 5.5.3 修改共振峰带宽 53-54 5.6 基频参数的修改 54-58 5.6.1 基频提取 54-55 5.6.2 基频修改 55-56 5.6.3 安多藏语方言基频变换结果 56-58 第六章 安多藏语方言语音音色转换系统 58-67 6.1 程序实现说明 58-61 6.1.1 读取源文件和目标文件 58-59 6.2.2 分析语音 59 6.2.3 修改共振峰 59-60 6.2.4 合成语音 60-61 6.2 算法性能介绍 61-62 6.3 藏语安多话音色转换结果 62-65 6.4 主观实验 65-67 6.4.1 ABX 测试 65-66 6.4.2 MOS 测试 66-67 第七章 结论和问题 67-68 7.1 结论 67 7.2 问题 67-68 参考文献 68-70 附录 70-79 致谢 79-80 在校期间研究成果 80
|
相似论文
- 认知无线电网络中的基于信道特征的主用户仿真攻击防御技术,TN925
- 棉纤维成熟度纵向图像分析研究,TP391.41
- 基于电话信道的声纹识别算法研究,TN912.34
- 宽幅矮塔斜拉桥结构参数分析及宽幅箱梁剪力滞效应研究,U448.27
- 基于日负荷曲线的用电行业构成比例在线修正方法研究,TM714
- 面向装备研制的产品平台构建研究,TJ08
- 竹子地上部分形态特征及生长建模研究,S795
- 基于机器视觉的汽车流量检测算法研究,TP391.41
- 面向全定制宏模块的时序建模技术研究与实现,TN47
- 水泥加固红土的力学特性及神经网络模型研究,TU446
- 基于人工神经网络的地下水源热泵系统节能诊断研究,TU831.3
- 随机载荷特征参数提取与疲劳寿命预测智能系统开发,TH87
- 基于机器视觉苹果检测算法的研究,TP391.41
- 焊缝X射线检测底片故障分类与图像识别方法研究,TP391.41
- 基于浮选泡沫图像处理的矿浆品位建模及仿真,TP391.41
- 语音情感识别研究,TN912.34
- 地磁匹配导航算法研究,TN966
- 孤立词语音识别算法优化的研究和实现,TN912.34
- 变压器温升及其对绝缘老化影响的研究,TM855
- 基于语音识别的机器人控制技术的研究,TP242
- 网络入侵异常检测的统计方法研究,TP393.08
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|