学位论文 > 优秀研究生学位论文题录展示
面向语音合成的维吾尔语韵律层级自动标注算法研究
作 者: 努尔比娅·塔依尔
导 师: 地里木拉提·吐尔逊;艾斯卡尔·艾木都拉
学 校: 新疆大学
专 业: 信号与信息处理
关键词: 维吾尔语 语音合成 韵律层 停顿级别 词性标注
分类号: TN912.33
类 型: 硕士论文
年 份: 2010年
下 载: 93次
引 用: 2次
阅 读: 论文下载
内容摘要
众所周知,在语音合成系统中合成语音的音质是多方面来评价的,如:清晰度,可懂度,自然度,连贯性和分词正确率等。随着语音合成技术的不断发展,人们对合成语音的自然度提出了更高的要求。本文为了进一步提高合成语音的自然度首先尝试了基于C45决策树预测方法,然后深入研究了维吾尔语韵律层级结构,在此基础上初步提出了两种边界预测方法并实现了韵律层级边界的自动预测。为了让合成语音的音质更接近人说话的声音本文做了如下详细的工作:1.本文深入研究维吾尔语中各种停顿的相关理论,把理论联系到实际进一步研究了日常生活中一般人的普遍说话方式和停顿习惯,总结出一系列的普遍现象最终制定了停顿规则。2.提高合成语音自然度作为研究背景,以建立陈述句中各韵律层级时长模型为研究目的,在进行大量收集数据前做了验证工作。即利用统计方法建立了各个韵律层级的时长模型。实验结果表明,这种研究思路和方法的可行性。3.已制定的维吾尔语韵律层级划分规则作为依据,把特殊情况特殊处理,针对已筛选的10610个典型文本句子进行了各韵律层级的人工标注。这些工作为提高语音合成自然度打下了一个坚实的基础。4.实现词性标注。首先根据应用领域的特点确定了词性的种类及其判定规则,筛选了文本句子并对其进行了手动词性标注,然后通过统计获得了词性概率表和词性对照表,最后采用基于HMM模型的二元文法来实现了维吾尔语词性自动标注。5.用决策树算法尝试了韵律短语的自动划分。6.初步确定单词,音节为基础的韵律层级自动划分算法并实现。用实际例子来验证算法的可行性。
|
全文目录
摘要 3-4 Abstract 4-8 第一章 引言 8-15 1.1 选题来源 8 1.2 研究韵律问题的重要性和必要性 8-10 1.2.1 选题背景 8-9 1.2.2 研究意义 9-10 1.3 其它语言韵律问题研究动态 10-12 1.4 维吾尔语音合成技术现状 12 1.5 本文研究内容 12-14 1.6 论文内容安排 14-15 第二章 维吾尔语陈述句韵律层级停顿模式研究 15-26 2.1 各韵律层级的定义 15-16 2.2 维吾尔语中的韵律层次结构 16-19 2.2.1 语调短语 17 2.2.2 韵律短语 17-18 2.2.3 韵律词 18-19 2.3 基于规则的韵律层级人工标注及其验证 19-25 2.3.1 人工文本标注简介 19-20 2.3.2 验证理论与实际的一致性 20-21 2.3.3 声音人工标注 21-22 2.3.4 实验结果及其分析 22-24 2.3.5 研究停顿的重要性 24-25 2.4 本章小结 25-26 第三章 自动划分算法研究与实现 26-54 3.1 词性标注简介 26-35 3.1.1 词性自动标注系统模块化设计 27-32 3.1.2 实验平台及数据准备 32-33 3.1.3 实验结果与分析 33-35 3.2 决策模型的创建 35-41 3.2.1 生成格式文本 36-37 3.2.2 生成样本数据文本 37-38 3.2.3 生成决策树 38-41 3.3 基于规则的韵律层级自动划分实现实验结果及其分析 41-54 3.3.1 基于单词的自动分层算法 41-46 3.3.2 基于音节的自动分层算法 46-51 3.3.3 实验结果分析 51-52 3.3.4 本章总结 52-54 第四章 总结与展望 54-57 4.1 论文总结 54-55 4.2 工作展望 55-57 参考文献 57-60 攻读学位期间发表的论文 60-61 致谢 61-62
|
相似论文
- 声道频响合成方法在军队姓名语音库的应用,TN912.3
- 《乌古斯传》的修辞研究,I207.9
- 基于嵌入式Linux语音合成关键技术的研究与实现,TN912.33
- 《汉语水平词汇等级大纲》甲级词汇词性标注研究,H146
- 移动音视频交互业务执行平台的研究,TN915.09
- 嵌入式语音合成技术的研究,TN912.33
- 现代锡伯语 维吾尔语 哈萨克语的共有词考,H2
- 仿真机器人控制系统,TP242
- 基于自动切分的PSOLA语音合成在大坝监控系统中的应用研究,TP277
- 基于统计NLP技术的甲骨卜辞的分析研究,TP391.1
- Ant在IVR系统测试的应用,TP311.52
- 基于VoiceXML的语音智能交互平台的研究与实现,TP311.52
- 语音库自动构建技术的研究,TN912.33
- 基于HMM的藏语语料库词性自动标注研究,H214
- LSA与SOM相结合的文本聚类算法应用研究,TP391.1
- 基于多层架构模型设计的呼叫中心设计及实现,TN99
- 基于HMM的可训练越南语语音合成系统,TN912.33
- 语音变调算法研究及其在语音合成中的应用,TN912.33
- 汉语词类划分与词性标注方法的研究,TP391.1
- 基于嵌入式技术的射频识别信息终端研究开发,TP368.12
- 基于GSM网络具有语音合成功能系统的设计与实现,TN912.33
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音合成
© 2012 www.xueweilunwen.com
|