学位论文 > 优秀研究生学位论文题录展示
基于特征提取的视频场景分类技术研究
作 者: 李凌
导 师: 杨华
学 校: 上海交通大学
专 业: 电子与通信工程
关键词: 视频监控 视频场景分类 光流 LDA k-means聚类 远程医疗 ActiveX
分类号: TP391.41
类 型: 硕士论文
年 份: 2012年
下 载: 107次
引 用: 0次
阅 读: 论文下载
内容摘要
随着人们对于安全意识的提高,目前视频监控系统已经得到了广泛的应用。传统的视频监控是通过人工监看来实现监控目的,这种方法不仅浪费了大量的人力和时间,效率低下,另外这种方法依赖监控者的注意力和主观意识,分析的结果并不能保证绝对的正确。在这种背景下,对于视频进行智能分析的算法研究就显得尤为重要。视频场景分类是视频智能分析算法的一种,它是一种非常基础也是非常重要的智能视频分析算法。视频场景分类算法能够给视频监控工作提供非常重要的参考信息,从而极大的减少人工监控的工作量,提高监控结果的准确率。目前它主要用于协助人工监控、视频数据管理和为深层次的视频分析提供支持等方面。视频场景分类算法主要可以分为两类:基于跟踪的和基于特征提取的。基于跟踪的视频场景分类算法是一种传统的视频场景分类算法,当视频场景内运动目标过多时,由于目标遮挡和跟踪轨迹的复杂性,这种算法的使用效果会比较差。而基于特征提取的视频场景分类算法则很好的解决了这个问题。本文着眼于基于特征提取的视频场景分类算法,在总结和分析当前主流的基于特征提取的视频场景分类算法的基础上,进一步进行了以下方面的研究。首先,本文针对传统的光流量化方案的缺陷,提出了一种自适应的光流量化方案。光流矢量是最常用、同时也是目前效果最好的特征提取算法。传统的算法一般是采用简单直接的固定量化方法。这种方法没有考虑到光流分布的特性,对光流矢量中所包含的视频信息提取不充分。本文在深入研究这些的基础上,提出了一种自适应量化方法。这种方法能够针对光流位置和方向分布的不同区域,根据光流分布的特性,来选择疏密程度不一致的分割量化方案。实验证明,这种方案能够从原始的光流矢量中提取更多的视频信息,从而使得量化后的光流矢量更贴合原始的视频特征,从而有效的提升算法性能。其次,本文针对传统的k-means聚类的后处理算法,提出了一种改进的k-means聚类后处理算法。传统的k-means聚类算法直接使用在视频场景分类算法里存在两处缺陷,本文分别提出了改进方案。第一,传统的k-means聚类算法采用随机选择的方法来选择初始的聚类中心,这样会导致聚类结果和算法效率的不稳定性。本文针对这一点提出了一种基于统计的寻找聚类中心的算法,即通过原始数据的统计规律,寻找原始数据中数据间距离较大的几个数据点,并将这些数据点作为初始的聚类中心。这种方法可以有效的提高算法收敛的速度,提升算法性能。第二,传统的k-means聚类算法由于仅考虑欧式距离,导致聚类过程中容易发生球状簇聚类的现象。为了解决这个问题,本文在传统的欧式距离里引入了调节参数。调节参数通过分析整个数据的同一坐标轴下坐标值的分布特性,找出不同坐标轴对于全部数据距离的贡献比率差异,并利用这种差异来定义了一种带参数的欧式距离。使用新的欧式距离可以有效的避免球状簇聚类的缺陷,使得最终聚类结果更贴合人们对于数据聚类的自然认知。实验证明,改进后的k-means聚类算法能够避免球状簇聚类和性能不稳定的缺陷,从而提升算法的整体性能。最后,本文实现了一种基于ActiveX和网页的远程医疗系统的客户端。本文研究了生理参数的传输特性,设计并实现了一种简单高效的生理参数传输协议,这种协议可以确保数据的准确性和数据流在传输时的稳定性。在此基础上,本文设计并实现了生理参数接收和显示的客户端。客户端是基于ActiveX技术实现的,主要借助了MFC框架来实现。本文设计了一个单向的语音系统,它配合H.264视听系统可以组成双向语音系统。本文给出了这个语音系统的设计方案和具体的实现思路。此外,本文简单的设计了客户端系统的网页,包括用户管理和参数设置模块等。最后文章给出了整套系统的展示图并给出了视频延迟和码率的测试结果,证明了整套系统的有效性。
|
全文目录
摘要 3-6 ABSTRACT 6-12 第一章 绪论 12-17 1.1 选题意义与背景 12-15 1.1.1 视频场景分类算法的研究意义 12-13 1.1.2 视频场景分类算法的研究现状 13-14 1.1.3 基于特征提取的视频场景分类算法的缺陷 14-15 1.2 论文的主要工作点及创新点 15-16 1.3 论文的内容安排 16-17 第二章 视频场景分类算法综述 17-29 2.1 视频场景分类算法的基本流程 17-18 2.2 特征提取算法综述 18-20 2.2.1 基于像素的特征提取算法 18-19 2.2.2 基于物体的特征提取算法 19 2.2.3 基于光流的特征提取算法 19-20 2.3 场景建模算法综述 20-27 2.3.1 基于模式识别的场景建模算法 21-23 2.3.2 基于状态模型的场景建模算法 23-25 2.3.3 基于语义模型的场景建模算法 25-27 2.4 小结 27-29 第三章 基于光流的特征提取算法研究及改进 29-48 3.1 光流算法的主要原理及对比分析 29-34 3.1.1 光流法的基本原理和H-S 稠密光流算法 30-32 3.1.2 块匹配光流算法 32-33 3.1.3 L-K 和金字塔L-K 光流 33-34 3.2 传统的光流结果量化算法分析 34-37 3.2.1 传统的光流结果量化算法 34-36 3.2.2 部分自适应的光流结果量化算法 36-37 3.3 改进的自适应量化算法 37-46 3.3.1 自适应量化的算法原理分析 37-40 3.3.2 统计去噪 40-42 3.3.3 自适应量化算法的步骤 42-46 3.4 小结 46-48 第四章 对场景建模结果进行后处理的方法研究及改进 48-66 4.1 后处理算法原理及步骤分析 48-52 4.1.1 基于k-means 的后处理算法 49-51 4.1.2 基于谱聚类的后处理算法 51-52 4.2 改进的基于K-MEANS 聚类的后处理算法 52-57 4.2.1 改进的基于k-means 聚类的后处理算法的原理 53-54 4.2.2 改进的基于k-means 聚类的后处理算法的流程 54-57 4.3 实验结果与分析 57-65 4.3.1 实验环境参数及实验流程 57-58 4.3.2 算法改进前后的实验结果对比及优势分析 58-64 4.3.3 算法改进后存在的问题及后续工作 64-65 4.4 本章小结 65-66 第五章 基于网页和ACTIVEX 技术的远程医疗系统客户端设计与实现 66-83 5.1 远程医疗系统的研究意义和研究现状 66-69 5.1.1 远程医疗系统的研究意义 66-68 5.1.2 远程医疗系统的研究现状 68-69 5.2 远程医疗系统的设计思路及系统结构 69-71 5.3 基于网页和ACTIVEX 技术的远程医疗系统客户端的设计 71-78 5.3.1 生理参数传输协议 71-73 5.3.2 基于ActiveX 技术的生理参数观测模块 73-75 5.3.3 基于ActiveX 技术的实时语音对讲模块 75-77 5.3.4 基于网页的用户管理和参数设置模块 77-78 5.4 基于ACTIVEX 技术的远程医疗系统客户端的实现 78-82 5.4.1 基于ActiveX 技术的远程医疗系统客户端的图片展示 78-80 5.4.2 基于ActiveX 技术的远程医疗系统客户端的性能测试 80-82 5.5 小结 82-83 第六章 总结与展望 83-86 6.1 总结 83-84 6.2 展望 84-86 参考文献 86-90 致谢 90-92 攻读硕士学位期间已发表或录用的论文 92-94
|
相似论文
- 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41
- 移动机器人视觉检测和跟踪研究,TP242.62
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于物联网的农产品安全监控系统与决策系统研究,TP277
- 基于机器视觉的车辆检测和车距测量方法研究,TP274
- 基于智能视频检测技术的交通灯控制,TM923.5
- 基于粒子群优化的Fuzzy c-mean聚类算法的基因芯片图像处理,TP391.41
- 基于改进光流场模型的医学图像非刚性配准算法研究及实现,TP391.41
- 基于Linux平台的Ad hoc网络应用与设计实现,TN929.5
- 现代水库自动观测系统的设计与实现,TV697.2
- 基于多视频矩阵控制协议的远程视频监控系统的设计与实现,TP277
- 视频监控运动目标检索方法研究,TP391.41
- 多摄像机视频监控中基于几何约束的目标匹配技术研究,TP391.41
- 基于蜜蜂视觉机理的光流辅助导航,TP391.41
- 基于PCI总线的双片SoC协作机制设计与实现,TN47
- 基于网络存储的流媒体服务器系统,TN919.8
- 基于SIP协议的多媒体通信的研究与实现,TN919.8
- 基于智能家居系统的音视频通信方案的研究与实现,TN919.8
- 基于嵌入式技术的远程视频监控系统研究,TP277
- 基于Wifi的嵌入式无线视频监控系统设计,TP277
- 网络视频监控系统设计与实现,TP277
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|