学位论文 > 优秀研究生学位论文题录展示
基于机器学习算法的自动图像标注
作 者: 蒋黎星
导 师: 侯进
学 校: 西南交通大学
专 业: 计算机应用技术
关键词: 自动图像标注 机器学习 决策树 集成分类算法
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 76次
引 用: 0次
阅 读: 论文下载
内容摘要
“语义清晰”是大规模数字图像管理的重要前提,现有的基于底层特征的图像内容和高级人为理解的图像语义之间存在巨大的鸿沟,因此通过计算机自动获取图像语义内容的研究具有十分重要的意义。自动图像标注的实质是通过对图像的底层视觉特征的处理和分析来获取高层语义关键词,用这组语义关键词表示图像的含义。基于分类的自动图像标注方法是当前图像标注领域中使用最广泛的方法之一。本文的研究目标是结合当前标注模型的特点应用机器学习算法对图像进行标注,与前期基于分类模型的自动图像标注经典算法相比,本文采用的决策树改进算法在分类精度和时间上有所改善,并且该系统可以利用人能理解的规则模型来标注图像。为了获取标注规则,本文将采集到的图像数据库预定义一组需要的关键词(或语义概念)。利用图像分割技术将数据库中的图像分割成许多不同的区域,每个区域大致对应于一个语义对象。然后对图像分割后所得到的各个区域提取出底层视觉特征,包括颜色、纹理和形状特征等。提取出区域的特征属性后,手动将有意义的区域归并为几个类,这几个类均为预定义的语义概念。特征属性数据可以作为后续机器学习的训练数据。然后该系统可以通过机器学习方法从这些特征数据中学习到语义概念,利用预定义关键词来标注各个区域,最后图像就可以被这些关键词标注出来。本文主要关注的机器学习算法为改进后的NewNBtree算法、SimpleC4.5算法和FastRandomForest算法,通过训练可以得到相应的标注模型,最终实现自动图像标注。在自动语义标注阶段,本文利用图像信息熵的概念对噪声区域进行剔除,更有效地提高了标注系统的准确度。本文通过标准Corel图像库和基于Corel图像库的不同10组训练集对采用的算法进行实验分析,验证了改进算法和标注系统的有效性和鲁棒性。实验结果表明本文所采用的机器学习算法比传统决策树算法更能有效地分类图像数据,并能够应用到较大规模图像集中实现图像的自动标注。
|
全文目录
摘要 6-7 Abstract 7-8 目录 8-10 第1章 绪论 10-16 1.1 研究背景与研究意义 10-11 1.2 国内外研究现状 11-13 1.2.1 基于分类的自动图像标注模型 12 1.2.2 基于概率的自动图像标注模型 12-13 1.2.3 其他方法 13 1.3 图像标注系统关键问题及研究任务 13-15 1.3.1 自动标注系统的框架 13-14 1.3.2 关键问题 14 1.3.3 研究任务 14-15 1.4 本文的结构安排 15-16 第2章 基于单棵决策树的自动图像标注 16-28 2.1 NewNBtree算法 16-18 2.1.1 算法思想 16-17 2.1.2 算法流程 17-18 2.1.3 算法实现 18 2.2 SimpleC4.5算法 18-22 2.2.1 算法思想 19-21 2.2.2 算法流程 21-22 2.2.3 算法实现 22 2.3 自动图像标注方法 22-27 2.3.1 自动图像标注流程 22-26 2.3.2 自动图像标注算法描述 26-27 2.4 本章小结 27-28 第3章 基于集成分类器的自动图像标注 28-36 3.1 集成分类器 28-33 3.1.1 集成学习算法 28-30 3.1.2 快速随机森林算法 30-33 3.2 基于快速随机森林算法的自动图像标注方法 33-35 3.2.1 基于快速随机森林的自动图像标注流程 33-34 3.2.2 基于快速随机森林的图像自动标注算法描述 34-35 3.3 本章小结 35-36 第4章 系统实现及结果分析 36-51 4.1 实验环境 36 4.2 Weka平台的二次开发 36-41 4.2.1 二次开发过程 36-37 4.2.2 二次开发实验 37-41 4.3 实验及结果分析 41-50 4.3.1 实验数据集 41-42 4.3.2 评价标准 42 4.3.3 基于机器学习算法的分类结果比较及分析 42-48 4.3.4 基于机器学习算法的标注系统实现 48-50 4.4 本章小结 50-51 结论 51-53 致谢 53-54 参考文献 54-58 攻读硕士学位期间发表的论文及科研成果 58
|
相似论文
- 基于支持向量机的故障诊断方法研究,TP18
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 基于数据分布特征的文本分类研究,TP391.1
- 基于条件随机场的中文分词技术的研究与实现,TP391.1
- 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
- Android恶意软件静态检测方案的研究,TP309
- 监督主题模型的研究与应用,TP391.1
- 基于失真效应的图像质量评价与分类,TP391.41
- 基于学习的逆向运动学人体运动合成,TP391.41
- 基于内容的网页恶意代码检测的研究与实现,TP393.092
- 学术主页信息抽取系统的研究,TP393.092
- 基于学生评教数据挖掘与教学质量分析系统的研究,TP311.13
- 社会化网络中的推荐算法及其应用,TP391.3
- 数据挖掘在邮件反垃圾系统中的应用,TP393.098
- 基于粗糙集理论的决策树分类算法与应用研究,TP18
- 基于核心示例集的属性约简方法研究,O159
- 基于自学习的社会关系抽取的研究,TP391.1
- 基于广义信息熵的决策树模型及其在绩效评价中的应用,TP18
- 基于统计与图模型的若干机器学习算法及其应用,TP181
- P2P流量识别方法研究,TP393.06
- 基于粗糙集和SVM的国防生综合素质测评方法研究,E075
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|