学位论文 > 优秀研究生学位论文题录展示

基于杜比的LossyMLP技术应用研究

作　者: 黄苇
导　师: 彭亦功；陈树荣
学　校: 华东理工大学
专　业: 控制工程
关键词: 声学模型有损压缩无损压缩音频编码 lossyMLP
分类号: TN912.3
类　型: 硕士论文
年　份: 2011年
下　载: 18次
引　用: 0次
阅　读: 论文下载

内容摘要

20世纪90年代开始,数字形式的音频存储(主要是CD)逐渐取代了传统的黑胶唱片和磁带。由于计算机技术的迅猛发展和普及,以及互联网的兴起,催生了新的音频压缩技术的发展,以感知编码技术为基础的音频压缩编码技术成为数字影音时代的主流。杜比实验室的杜比数字技术即为感知编码技术的代表之一。随着感知编码技术的普及,它固有的有损特性已不符合消费者对更高音乐品质的追求。更由于硬盘,光存储等数字存储设备的存储能力大幅增加和成本的下降,无损音频编码逐渐引起了普遍的关注。然而现代音乐的主流形式如Pop、Meta、R&B等,因其宽频和瞬态特性,信息熵很大而难于压缩。本文结合本人杜比实验室十几年的工作经验和对音频压缩编码技术的研究,基于音频压缩技术的发展历程和杜比实验室的杜比数字技术深入分析,研究和剖析比较了有损压缩编码技术和无损压缩编码技术,并用C++自行开发了lossyMLP/lossyTrueHD应用程序,在此基础上提出了将有损与无损两大类算法有效结合的杜比lossyMLP技术,且可将其用于对带宽与存储能力有一定要求的制作、存储和分发系统中。其中,包括提出一种接近无损的lossyWAV前处理方法,配合杜比实验室的无损压缩技术MLP,生成的lossyMLP文件压缩率较原始的MLP文件压缩率高。前处理仅相当于加大了背景噪声,因加入的噪声与实际音频大小相关,从而被实际编码的信号所掩盖；数字音频处理过程中未用到人耳感知模型技术,故亦用作其它有损编码的可靠的信号源。lossyMLP技术的研究应用结果证明：lossyMLP技术作为内容供应商的音源存储格式可以为其节省大量的存储成本,因不存在格式兼容性的问题,lossyMLP可直接嵌入已有系统进行运作。而且,若将声学模型引入lossyMLP控制加入噪声的频谱形状,将会进一步增加压缩效率,进而对高码率的有损压缩格式形成竞争压力；因此,论文工作对进一步提高数字存储设备的存储能力、大幅降低其成本具有一定的应用研究价值。

全文目录

摘要  5-6
Abstract  6-10
第1章绪论  10-17
  1.1 音频压缩技术的历史回顾  10-11
  1.2 音频压缩算法的主要分类及典型代表  11-13
    1.2.1 音频压缩编码技术概述  11-12
    1.2.2 时域压缩  12
    1.2.3 子带压缩  12-13
    1.2.4 变换压缩  13
  1.3 国内外音频压缩技术最新进展  13-14
  1.4 课题研究意义  14-15
  1.5 论文主要内容及章节安排  15-17
第2章有损压缩编码技术  17-27
  2.1 心理声学原理  17-20
    2.1.1 绝对听觉阂值  17-18
    2.1.2 听觉系统的临界频带  18
    2.1.3 音频信号的掩蔽效应  18-19
    2.1.4 感知熵  19-20
  2.2 心理声学模型的应用  20-24
    2.2.1 MP3编码架构  20
    2.2.2 心理声学模型Ⅱ的计算流程  20-22
    2.2.3 MP3预回声控制技术  22-24
  2.3 杜比数字(AC-3)编解码技术  24-26
  2.4 本章小结  26-27
第3章无损压缩编码技术  27-44
  3.1 香农-范诺与霍夫曼编码  27-29
    3.1.1 香农-范诺编码  27-28
    3.1.2 霍夫曼编码  28-29
  3.2 算术编码  29-32
  3.3 RLE编码  32-33
  3.4 词典编码  33-37
    3.4.1 词典编码的思想  33-34
    3.4.2 LZ77算法  34-36
    3.4.3 LZ78算法  36-37
  3.5 无损音频编码基本原理  37-39
  3.6 无损音频编码器的实现  39-42
    3.6.1 分帧  39
    3.6.2 帧内去相关  39-41
    3.6.3 熵编码  41-42
  3.7 本章小结  42-44
第4章杜比专利技术  44-49
  4.1 杜比实验室(Dolby Laboratory)  44-45
  4.2 Dolby专利技术  45-48
    4.2.1 杜比数字技术(Dolby Digital)  45-46
    4.2.2 MLP Lossless无损压缩技术  46
    4.2.3 AAC(先进音频编码)  46-47
    4.2.4 杜比数字+技术(Dolby Digital Plus)  47-48
    4.2.5 杜比TrueHD技术(Dolby TrueHD)  48
  4.3 本章小结  48-49
第5章 lossyMLP技术的研发  49-58
  5.1 MLP无损压缩技术  49-51
  5.2 有损及无损压缩的缺点  51-52
  5.3 LossyWAV信号处理流程  52-53
  5.4 LossyMLP/LossyTrueHD应用程序的开发  53-57
    5.4.1 LossyMLP/LossyTrueHD应用程序构架设计  53-54
    5.4.2 LossyMLP/LossyTrueHD应用程序实现与分析  54-57
    5.4.3 LossyMLP/LossyTrueHD应用程序展示  57
  5.5 本章小结  57-58
第6章 lossyMLP技术的应用  58-64
  6.1 LossyMLP可行性的实验验证  58-60
  6.2 LossyMLP技术的优势  60
  6.3 LossyMLP技术应用  60-63
    6.3.1 基于LossyMLP的节目制作、存储和分发系统  61
    6.3.2 基于LossyMLP的高保真节目直播系统  61-62
    6.3.3 基于LossyMLP的多受体实时点播系统  62-63
  6.4 本章小结  63-64
第7章总结与展望  64-66
  7.1 本文工作总结  64-65
  7.2 展望  65-66
参考文献  66-70
附录一 lossyMLP应用程序部分源代码  70-78
致谢  78

相似论文

基于矢量量化的高光谱图像无损压缩算法研究,TP751.1
基于自适应的LVCSR系统半监督学习方法的研究,TN912.34
AVS音频编码算法研究,TN911.21
基于PADK的音频编码器开发平台设计,TN762
泡沫铝复合结构声学性能分析与实验研究,TB383.4
基于压缩感知理论的视频帧间信号编码研究,TN919.81
基于H.323的网络视频会议监视系统的研究与实现,TN948.63
音频分类技术研究,TN912.3
音频信号检测技术研究,TN912.3
电厂厂级监控信息系统的设计与实现,TM769
自适应音频水印算法研究,TP309.7
多孔混凝土材料的减振吸噪性能研究,U414
一种易于硬件实现的图像有损压缩算法,TP391.41
泡沫铝消声器性能分析与实验研究,TB535.2
基于心理声学模型的AVS音频水印算法研究,TP309.7
广播语音的自动标注系统,TN931
火电厂过程数据特性的分析与研究,TP311.13
基于发音词典自适应的民族语口音汉语普通话语音识别,TN912.34
声学黑洞熵的砖墙模型导出及二体量子纠缠度在洛仑兹变换下的性质,O414;O413.3
多通道数据采集系统数据压缩算法的研究与实现,TP274.2