学位论文 > 优秀研究生学位论文题录展示
基于VoiceXML的语音增值业务平台及其算法的研究
作 者: 王文林
导 师: 廖建新
学 校: 北京邮电大学
专 业: 计算机应用技术
关键词: 语音增值业务平台 VoiceXML 预取 缓存替换 缓存一致性控制 多方通信 混音
分类号: TP311.52
类 型: 博士论文
年 份: 2007年
下 载: 223次
引 用: 1次
阅 读: 论文下载
内容摘要
在当前以及下一代网络中,语音业务是最重要的业务,占有非常大的比重,是运营商主要的盈利手段。而语音增值业务的蓬勃发展给运营商带来的并不只是直接的利润,它还提高了现有设备的利用率,更给用户带来了新的语音体验,提高了用户对运营商的忠诚度,吸引更多的用户使用该运营商的网络,也给运营商的其他业务带来了潜在的客户和利润。然而,现有语音增值业务平台的封闭、不灵活、维护困难、业务开展困难等缺点难以根除。随着语音增值业务的发展,用户数量的增加,现有的语音增值业务平台已经不能满足需求,变成了阻碍语音增值业务进一步发展的因素。所以新的语音增值业务平台应运而生,而已经成为语音浏览器的规范的VoiceXML(Voice eXtensible Markup Language,语音可扩展标志语言)具有开发灵活、业务开展方式简单等优点,是新的语音增值业务平台的最佳选择之一。本论文受国家杰出青年科学基金(No.60525110)、新世纪优秀人才支持计划(No.NCET-04-0111)、高等学校博士学科点专项科研基金资助课题(No.20030013006)资助,对基于VoiceXML的语音增值业务平台和其中涉及的一些算法进行了研究。目前,在研究成果的基础上已经完成了一个语音增值业务系统的开发,并且已在多个省份部署,拥有数百万的增值业务用户。论文对研究过程中取得的主要创新成果进行了详细阐述。这些创新工作简要归纳如下:1) VoiceXML语音增值业务平台通过网络来获取VoiceXML业务脚本和业务资源,所以不可避免地引入了网络时延,而电话用户对时延极其敏感。为了解决这个问题,对VoiceXML语音增值业务平台中的预取方案进行了研究,并认为在VoiceXML语音增值业务平台中预取的对象应是VoiceXML业务脚本中引用的业务语音资源,提出了一种自适应多用户共享的Markov预测算法,利用语音增值业务平台可以感知用户是否在线的特点,统一计算所有在线用户下一步所需的资源及其概率,提高了预测的准确率;进一步提出应采用抢占式优先级调度算法对预取任务进行调度,将资源将会被访问的概率映射为优先级参与排队进行预取调度。仿真研究表明,自适应多用户共享的Markov预测算法比目前的单用户Markov预测算法对资源未来的使用概率的预测更加准确,采用抢占式优先级调度模型也能比目前的循环调度模型得到更好的预取效益。两种算法结合可以有效地降低网络时延带来的影响,提高语音增值业务平台的响应速度,减少用户的等待时间。2)为了更好地降低网络时延带来的不良影响,对缓存替换算法作了深入地研究,在分析了现有的若干缓存替换算法后,指出替换算法应该分成两个关键问题,其一是确定资源的效用函数,其二是替换过程的算法。针对第一个问题,改进了LRU-K(K-Least Recently Used,K阶最近使用)算法并提出了新的效用函数PLRU-K(Perfect LRU-K,完美的LRU-K);对于第二个问题,根据0/1背包原理,提出了采用一阶优化贪婪替换过程(1-optimal Greedy Replacement Process,1-GRP)算法对缓存进行替换选择。仿真结果显示,PLRU-K的效用函数要比LRU-K、P-LFU(Perfect Least Frequently Used,完美的最少使用)效用函数更能体现缓存资源未来的使用收益;1-GRP算法要比P-GRP(Profit-based Greedy Replacement Process,基于收益的贪婪替换过程算法)、PD-GRP(Profit-Density-based Greedy Replacement Process,基于收益密度的贪婪替换过程算法)更能让缓存获得更大的收益;基于PLRU-K和1-GRP的缓存替换算法的性能要超过其他的替换算法,特别是在缓存空间较小的情况下。3)为了避免缓存中的VoiceXML文档及资源与服务器上的原件不一致而将过期的数据提供给用户,缓存的一致性控制算法不可或缺。本文讨论了在Web环境中,在不对HTTP(HyperText Transfer Protocol,超文本传输协议)及Web服务器进行任何修改的前提下,如何更好地实现缓存一致性控制的问题。在分析了目前一致性控制算法的优劣的基础上,考虑到VoiceXML文档的特性,根据Web文档修改时间间隔满足负指数分布这一结论,提出了随机分布拟合预测算法,使用参数估计的方法来拟合VoiceXML文档修改时间间隔的随机分布,再通过此分布预测VoiceXML文档改变的概率,用以指导是否应使用缓存内的文档。仿真研究表明,使用随机拟合分布预测算法能得到小于0.01%的文档过期率,基本满足电信系统中呼损率的要求,同时能获得较大的性能提高。4)针对VoiceXML中不能直接提供多方通信控制功能的问题,提出对VoiceXML的object元素提供的功能进行扩展;在讨论了多方通信控制所需要的具体功能之后,提出了阻塞式和非阻塞式两种不同的object扩展方案并分析了各自的优劣,还举例说明了如何使用这些object。5)在电话会议的应用中,混音是一个关键的问题,而目前的混音算法都没有很好地克服混音后音量忽大忽小变化的问题。在分析了目前的混音算法之后,提出了非均匀波形收缩混音算法,该算法基于在语音信号中低强度信号比高强度信号出现几率更高的事实,采用与混音路数无关的恒定混音权重进行混音操作。同时该算法不需要进行乘除法操作,没有浮点运算,容易采用硬件实现。实验证明,该混音算法效果理想,混音后的语音自然流畅,没有噪音,在多路语音输入时仍能保证语音质量,并且是目前最快的混音算法之一,完全能满足语音会议中高性能、高并发的混音要求。本论文的研究成果不仅可以用于基于VoiceXML的语音增值业务平台中,对于其他语音增值业务平台和相关领域的研究也具有很好的参考价值。
|
全文目录
摘要 4-7 ABSTRACT 7-17 第一章 语音增值业务和VOICEXML 17-29 1.1 语音及其增值业务 18-21 1.1.1 语音业务的主导地位 18-19 1.1.2 语音增值业务 19-20 1.1.3 语音增值业务平台现状 20-21 1.2 VOICEXML概述 21-24 1.2.1 VoiceXML应用系统基本结构 22-23 1.2.2 VoiceXML相关概念 23-24 1.3 VOICEXML语音增值业务平台面临的问题 24-26 1.3.1 网络带来的时延 25-26 1.3.2 多方通信控制 26 1.4 VOICEXML的应用前景 26-27 1.5 本章小结 27-29 第二章 基于VOICEXML的语音增值业务系统的架构设计 29-40 2.1 语音增值业务系统的结构 29-36 2.1.1 语音增值业务平台的功能 31-33 2.1.2 语音增值业务管理平台的功能 33-36 2.2 VOICEXML语音增值业务平台 36-37 2.2.1 VoiceXML语音增值业务平台的物理结构 36 2.2.2 VoiceXML语音增值业务平台的软件结构 36-37 2.3 语音增值业务系统与现有平台的比较 37-38 2.4 本章小结 38-40 第三章 VOICEXML语音增值业务平台中预取方案的研究 40-52 3.1 预取领域的相关研究 40-43 3.1.1 预取预测算法 40-42 3.1.2 预取调度算法 42 3.1.3 本文提出的预取方案及算法 42-43 3.2 VOICEXML语音增值业务平台中的预取方案 43-49 3.2.1 预取对象 43-44 3.2.2 预测算法 44-46 3.2.3 调度算法 46-49 3.3 仿真及结果分析 49-50 3.4 本章小结 50-52 第四章 VOICEXML语音增值业务平台中缓存替换算法的研究 52-63 4.1 缓存替换算法的相关研究 53-55 4.1.1 基于资源访问的局部性原理 53-54 4.1.2 基于资源的访问频率 54 4.1.3 基于资源的关键特征 54-55 4.1.4 现有替换算法的不足 55 4.2 改进的缓存替换算法 55-59 4.2.1 PLRU-K效用函数 56-58 4.2.2 一阶优化贪婪替换过程算法 58-59 4.3 仿真实验及结果分析 59-62 4.4 本章小结 62-63 第五章 VOICEXML语音增值业务平台的缓存一致性控制算法的研究 63-83 5.1 一致性算法的相关研究 63-65 5.2 随机分布拟合预测算法 65-72 5.2.1 算法模型 65-66 5.2.2 参数拟合 66-69 5.2.3 预测算法 69-72 5.3 性能研究 72-78 5.3.1 仿真说明 72-73 5.3.2 仿真结果及分析 73-78 5.4 现网数据分析 78-81 5.4.1 分布假设检验方法 79-80 5.4.2 数据分析 80-81 5.5 本章小结 81-83 第六章 VOICEXML支持多方通信的研究 83-98 6.1 OBJECT元素 83-85 6.1.1 object元素的属性 84 6.1.2 obiect元素的子元素 84 6.1.3 object元素使用举例 84-85 6.2 多方通信能力分析 85-86 6.3 OBJECT扩展方案 86-93 6.3.1 创建会议 86-87 6.3.2 加入会议 87-89 6.3.3 查询信息 89-90 6.3.4 成员管理 90-91 6.3.5 会议录音 91-92 6.3.6 删除会议 92-93 6.4 OBJECT扩展方案二 93-96 6.5 两种方案的比较 96-97 6.6 本章小结 97-98 第七章 多方通信中快速实时混音算法的研究 98-109 7.1 混音处理过程 98-99 7.2 混音原理 99-100 7.3 已有混音算法分析 100-102 7.3.1 平均算法 100 7.3.2 对齐算法 100-101 7.3.3 箝位算法 101-102 7.3.4 自对齐算法 102 7.4 非均匀波形收缩混音算法 102-105 7.4.1 算法基本思想 102-104 7.4.2 算法实现与优化 104-105 7.5 实验结果 105-107 7.6 本章小结 107-109 结束语 109-111 参考文献 111-118 攻读博士学位期间录用和发表的论文 118-119 攻读博士学位期间申请的专利 119-120 致谢 120
|
相似论文
- 高效能嵌入式处理器IP核,TP332
- 多应用环境下自适应预取策略研究,TP333
- VoiceXML 的应用研究,TP312.2
- 基于VoiceXML的语音智能交互平台的研究与实现,TP311.52
- 数据缓存技术在Mashup中的应用研究,TP333
- 基于VoiceXML技术的可视化IVR系统设计和实现,TN912.3
- 网络电话会议中混音技术的研究,TN948.63
- 基于P2P的网络音频捕获与多路混音算法研究,TN912.3
- 基于SIP协议的语音浏览器的设计与实现,TN916.2
- 民用机载音频系统模拟器的研究及实现,V243
- 基于双关联图的Web预取模型研究,TP393.09
- 基于SIP协议的视频会议系统设计,TN948.63
- 魔力平台中数据查询优化的研究,TP18
- 基于WEB访问特性的代理缓存机制的研究,TP393.06
- 基于VoiceXML的语音门户设计和实现,TP311.52
- 仿真平台中动画展现的多帧平滑策略的研究,TP391.9
- 一种Deep Web数据集成系统预取策略的研究,TP311.13
- SIP协议分布式会议系统的研究,TN916.2
- 基于局域网的音频实时记录和监听系统的设计与实现,TP277
- 引入flash的多层次存储结构研究与实现,TP333
- 基于对象的分级存储系统数据迁移技术研究,TP333
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com
|