学位论文 > 优秀研究生学位论文题录展示

微博图像文字内容识别与感知

作 者: 陈永波
导 师: 刘云
学 校: 北京交通大学
专 业: 通信与信息系统
关键词: 微博图像 文字识别 支持向量机 Gabor特征
分类号: TP393.092
类 型: 硕士论文
年 份: 2014年
下 载: 44次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,微博网络的兴起与发展对科研领域带来了许多新的研究内容,并推动了自然语言处理、复杂网络社区发现等多个领域的研究。将多媒体中的内容提取并作为相关研究的样本,对以微博为研究对象的科研工作将具有良好的帮助作用。同时,对图片中的文字进行提取和识别也将极大地方便计算机自动化处理,在商业运用上也具有广阔的前景。图像文字识别主要作为模式识别中的一个重要分支,经历多年的发展后技术已经非常成熟,研究领域也逐渐扩展到自然场景文本识别、手写字符文本识别等方面,并获得了良好的应用。在文字识别的理论基础上,本论文主要工作为对文字识别中的文本定位和特征提取工作进行了研究和改进。并将图像文字识别技术应用到微博内容研究中,将提取和识别的文字保存,可以提供给其他研究领域进行进一步分析处理。本文在文本定位过程中结合图像的纹理和边缘特征,提出使用多尺度Gabor滤波器组对原图像进行变换处理,结合文本区域的先验知识对变换结果中的非文本对象进行过滤处理。边缘提取步骤中,使用Sobel算法对图像进行处理。将所获得的特征图像和边缘图像进行融合,并采用图像形态学的方法对融合结果作进一步的细节处理,从而获得文本区域。该方法提高了文本定位过程的准确性,在实际应用过程中的参数设置对经验值的依赖程度较小,具有较强的适应性。在单字符的特征提取中,采用了多尺度的Gabor滤波器组提取图像特征,形成一组包含多尺度多方向纹理特征的向量,最后使用SVM对所形成的纹理特征进行分类。最后,将上述方法应用到微博网络中,建立一个微博图像的采集和文字内容识别系统,完成微博图像的采集和逐步识别的功能,对提出的定位方法进行了验证。论文的工作得到了国家自然科学基金(No.61172072,61271308)、北京市自然科学基金(No.4112045)、高等教育博士点基金(No.W11C100030)、北京科技计划(No.Z121100000312024)和北京市教育委员会学科建设与研究生建设项目等课题的支持。

全文目录


致谢  5-6
中文摘要  6-7
ABSTRACT  7-11
1 绪论  11-16
  1.1 研究背景  11-14
    1.1.1 微博起源及发展现状  11
    1.1.2 微博图像文字内容的特点  11-13
    1.1.3 微博信息和传播的特点  13-14
  1.2 研究意义  14-15
  1.3 论文内容及论文结构安排  15-16
2 相关技术概述  16-24
  2.1 文本定位技术  16-20
    2.1.1 基于区域的方法  17-18
    2.1.2 基于边缘的方法  18-19
    2.1.3 基于特征的方法  19-20
  2.2 字符分割技术  20-22
    2.2.1 基于投影和连通分析的方法  20-21
    2.2.2 基于识别的方法  21-22
  2.3 字符识别技术  22-23
    2.3.1 特征提取  22
    2.3.2 分类方法  22-23
  2.4 本章小结  23-24
3 图像的预处理  24-33
  3.1 图像的灰度化  24
  3.2 图像平滑  24-25
  3.3 图像的二值化  25-26
  3.4 图像的边缘提取  26-29
  3.5 图像边缘的形态学处理  29-32
    3.5.1 膨胀操作(Dilate)  29-30
    3.5.2 腐蚀操作(Erode)  30-31
    3.5.3 开运算(Open)  31-32
    3.5.4 闭运算(Close)  32
  3.6 本章小结  32-33
4 Gabor组特征结合边缘特征的图文本定位  33-40
  4.1 Gabor组特征与边缘特征  33-38
  4.2 字符分割和图像归一化  38
  4.3 本章小结  38-40
5 特征提取与分类  40-49
  5.1 特征提取  40-41
  5.2 分类识别  41-48
    5.2.1 软边界形式  45-47
    5.2.2 常用核函数  47-48
  5.3 本章小结  48-49
6 系统设计与实现  49-54
  6.1 训练样本的生成  50
  6.2 特征提取  50-52
  6.3 分类识别  52-53
  6.4 本章小结  53-54
7 总结与展望  54-56
  7.1 论文总结  54
  7.2 研究展望  54-56
参考文献  56-58
作者简历  58-60
学位论文数据集  60

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  10. 基于图像的路面破损识别,TP391.41
  11. 基于支持向量机的故障诊断方法研究,TP18
  12. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  13. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  14. 基于车载3D加速传感器的路况监测研究,TP274
  15. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  16. 不匹配信道下耳语音说话人识别研究,TN912.34
  17. 基于文本挖掘的学者简历自动生成,TP391.1
  18. 基于特征选择的入侵检测研究,TP393.08
  19. 基于SVM的跨膜蛋白结构预测应用研究,Q51
  20. LS-SVM算法预测煤层瓦斯涌出量技术研究及应用,TD712.5
  21. 基于支持向量机的故障诊断研究,TH165.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com