学位论文 > 优秀研究生学位论文题录展示

视频语义提取分析研究

作 者: 江超
导 师: 封化民
学 校: 西安电子科技大学
专 业: 密码学
关键词: 内容安全 音频分类和分割 自动语音识别
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 62次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着计算机网络和多媒体技术的迅猛发展,数字视频在人们的生活中成为不可或缺的信息载体。但是在这些视频中,还夹杂着一些不良内容,它们给社会带来相当大的“不良信息冲击”。因此,视频的内容安全在社会生活和国家安全等方面都占据了非常重要的位置。视频语义分析是视频内容安全的重要研究内容。作为视频的一种高级语义线索,视频中的音频所包含的信息对于理解视频的内容是很有价值的。如何对各种音频进行分类,并提取语音部分进行语音识别对视频语义分析具有重要意义。本文提出了一种应用于视频语义分析的音频分类和语音识别框架。首先,采用基于规则和基于支持向量机(SVM)的音频分类方法,将音频帧分为静音、语音和音乐。根据音频类别信息,设计切分算法,对相同类型的音频进行聚类,得到音频分割信息。在音频切分基础上,本文使用Sphinx工具包构建了一个自动语音识别系统,对语音段进行语音识别,提取视频脚本信息。对TRECVID 2005中的视频进行实验,实验结果表明了本文提出的分析研究方法的有效性。

全文目录


摘要  3-4
Abstract  4-7
第一章 绪论  7-13
  1.1 课题研究背景与意义  7
  1.2 相关理论及研究现状  7-10
  1.3 论文主要研究内容  10-11
  1.4 论文组织结构  11-13
第二章 系统总体结构设计  13-15
  2.1 总体结构  13
  2.2 各部分工作内容  13-14
  2.3 本章小结  14-15
第三章 音频分类和分割  15-27
  3.1 基本概念  15-17
    3.1.1 音频语义内容分析  15-16
    3.1.2 音频结构分析  16-17
  3.2 SVM 分类原理  17-19
  3.3 音频特征提取  19-23
    3.3.1 音频预处理  19-20
    3.3.2 音频特征提取  20-23
  3.4 分类器设计  23-25
  3.5 音频分割  25-26
    3.5.1 滑窗法  25
    3.5.2 基于规则的音频分割方法  25-26
  3.6 本章小结  26-27
第四章 语音识别系统的设计和实现  27-39
  4.1 语音识别的基本概念  27-29
    4.1.1 语音识别技术的历史  27-28
    4.1.2 语音识别技术的分类  28
    4.1.3 语音识别技术中的难点  28-29
  4.2 HMM 基本原理及在语音识别中的应用  29-34
    4.2.1 HMM 基本概念  29-30
    4.2.2 HMM 的三个基本问题  30-34
  4.3 语音识别系统的设计  34-37
    4.3.1 特征提取  35
    4.3.2 声学模型和语言模型  35-36
    4.3.3 解码  36-37
  4.4 本章小结  37-39
第五章 系统性能测试和结果分析  39-43
  5.1 实验数据与实验环境  39
  5.2 评测方法和结果分析  39-42
    5.2.1 音频分类和分割结果与分析  40-41
    5.2.2 语音识别结果和分析  41-42
  5.3 本章小结  42-43
第六章 总结与展望  43-45
  6.1 总结  43
  6.2 展望  43-45
致谢  45-47
参考文献  47-51
在读期间的研究成果  51-52

相似论文

  1. 移动机器人语音识别控制仿真系统的设计与实现,TN912.34
  2. 分布式非结构化文本数据安全分析系统研究与设计,TP393.08
  3. 新闻视频内容结构分析研究,TP391.41
  4. 基于内容的短信息审计系统研究与实现,TP311.52
  5. 分布式资源安全监控系统的研究,TP393.08
  6. IP网络流量测量与分析,TN915.06
  7. 基于自动语音识别的在线软件对中国大学生音素学习的有效性研究,H319
  8. 基于字频的模式匹配算法研究,TP393.08
  9. 基于容错粗糙集的话题检测与跟踪方法研究,TP391.1
  10. 电视视频字幕文字的提取方法研究,TP391.41
  11. 区分性训练和区分性自适应在自动语音识别声学模型优化中的应用,TN912.34
  12. 网站内容安全管理平台的设计与实现,TP311.52
  13. 基于Ontology的Web多媒体内容安全分析,TP391.1
  14. 数字视频中的语义提取分析与研究,TP391.41
  15. Web新闻视频内容语义安全分析,TP391.41
  16. Web主题网页内容安全监管研究,TP391.1
  17. 基于ASR的呼叫中心实现及客户分类研究,TN99
  18. UMS中的TTS/ASR技术研究,TP311.52
  19. 基于ontology的内容安全技术研究与实现,TP393.08
  20. 非法互联网网站及服务实时监管取证系统,TP393.092

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com