学位论文 > 优秀研究生学位论文题录展示
一种基于视觉的网页分割技术及应用研究
作 者: 彭红超
导 师: 童名文
学 校: 华中师范大学
专 业: 教育技术学
关键词: 基于视觉 网页分割 最优化理论 样式信息 内容块相似度 权值确定 精品课程
分类号: TP393.092
类 型: 硕士论文
年 份: 2014年
下 载: 1次
引 用: 0次
阅 读: 论文下载
内容摘要
CNNIC第33次中国互联网络发展状况统计报告显示,仅5年时间,手机网民由1.78亿猛增至5亿人,占总体网民81.0%,并保持稳定增长趋势,由此可知手机网民已成为稳定增长的庞大用户群体。而手机屏幕尺寸和运算能力的局限性,导致手机浏览器无法正常呈现、甚至无法打开针对PC设计的Web网页。随着微电子技术与移动通信技术的迅速发展,该矛盾日益突出和尖锐。针对该问题,提出VWS技术,以解决手机浏览器无法准确、高效地显示Web网页问题,从而提高用户体验。VWS技术从视觉角度标识网页中内容块的特征,之后基于最优化理论,把网页分割看作分组最优化问题,将网页分割为语义完整且适合手机显示的子页网。最后,选取特定子页作为首页推送给用户,用户可根据需要切换浏览各子页。该技术创新地提出网页预处理算法,将网页内容与样式信息进行融合,实现样式信息充分、高效地利用;创新地依据人类视觉特征从六个维度描述内容块视觉特征,并定义内容块在视觉特征方面的相似度计算公式,之后设计神经网络直接确定公式中每个维度的权值,此权值直接确定法较专家经验法真实、客观,比传统神经网络权值确定法高效、逼真;创新地将网页分割看作分组最优化问题,并基于最优化理论中的Kruskal算法设计网页分割算法。在确保手机正常显示的前提下,实现各子页中内容块间的相似度最大化,提高了各子页中内容块间的语义的相关性与完整性。ECs中含优质数字化学习资源高达125.64万,随着非正式学习理论在我国迅速流行加之手机的便捷性,越来越多的学习者希望通过手机访问ECs网页。因此,可以将VWS技术应用于ECs中,并以ECs为实验对象验证VWS技术的可行性,借此解决ECs网页在手机浏览器中的显示问题,增加ECs的访问渠道,从而促进精品课程的建设与发展。实验中随机选取100个不同的ECs网站,在每个网站中随机获取一个网页,采用VWS技术与VIPS技术分割得到的100个ECs网页,并对分割结果进行定性实验与定量实验。分析结果表明,VWS技术可出色地完成Web网页分割,实现针对PC端设计的网页在手机中的正常显示,并且具有较好的用户体验。
|
全文目录
摘要 5-6 Abstract 6-10 1 绪论 10-18 1.1 研究背景及意义 10-11 1.1.1 研究背景 10-11 1.1.2 研究意义 11 1.2 研究现状 11-14 1.3 研究内容 14-15 1.4 研究方法与技术路线 15-16 1.4.1 研究方法 15 1.4.2 技术路线 15-16 1.5 论文组织结构 16-18 2 网页分割预处理算法 18-30 2.1 引言 18 2.2 算法设计 18-26 2.2.1 样式信息获取 18-20 2.2.2 样式信息和标签关联 20-25 2.2.3 HTML和关联类列表输出 25-26 2.3 算法准确度分析 26-29 2.3.1 定性实验与分析 26-27 2.3.2 定量实验与分析 27-29 2.4 本章小结 29-30 3 内容块相似度计算 30-39 3.1 引言 30 3.2 内容块定义 30 3.3 算法设计 30-38 3.3.1 内容块特征标识 30-32 3.3.2 相似度公式定义 32-35 3.3.3 各维度相似度权值直接确定 35-38 3.4 本章小结 38-39 4 网页分割算法 39-49 4.1 引言 39 4.2 网页分割本质 39-40 4.3 算法设计 40-48 4.3.1 单元内容块获取 40-41 4.3.2 内容块像素面积计算 41-43 4.3.3 Web网页分割 43-45 4.3.4 Web网页重构 45-48 4.4 本章小结 48-49 5 VWS技术在ECs中的应用 49-59 5.1 引言 49 5.2 VWS技术组件部署 49-50 5.3 应用实例 50-51 5.4 应用效果分析 51-58 5.4.1 定性实验与分析 52-55 5.4.2 定量实验与分析 55-58 5.5 本章小结 58-59 6 结论与展望 59-62 6.1 结论 59-60 6.2 展望 60-62 参考文献 62-66 攻读学位期间参与项目及科研成果 66-67 致谢 67
|
相似论文
- 高校精品课程视频资源应用现状与对策研究,G642.3
- 基于平衡计分卡的精品课程网站绩效评价指标体系设计,G434
- 国家精品课程资源支持师范生教育技术能力发展的模式构建,G652.0
- 基于.NET的精品课程管理系统分析与设计,TP311.52
- 基于ASP的高频电路精品课程动态网站的设计与实现,TN70-4
- 基于结构振动梁桥损伤识别方法的研究,U441.4
- 绩效技术在精品课程效果评价中的研究,G423
- 信息构建与精品课程网站建设研究,TP393.092
- 精品课程网站建设项目管理的研究和实践,G434
- 网络拥塞控制算法的稳定性研究,TP393.06
- 中石化西安分公司催化裂化装置风险评价研究,TE624.41
- 国家级精品课程《大学英语》课堂教学个案研究,H319
- 高师院校“现代教育技术”精品课程建设现状和对策研究,G40-057
- 城市电网负荷削减优化模型的研究,TM715
- 影响北京市部分普通高校武术课程发展的若干因素研究,G852-4
- 《远程教育学》精品课程网络教学资源建设,G434
- 《多媒体网络课件设计与制作》精品课程网络教学资源建设研究,G434
- 中外开放教育资源建设比较研究,G434
- 国家精品课程建设与共享的现状调查及对策研究,G423
- 《广告设计》精品课程网站的设计与实现,TP393.092
- 物流设备招标采购中的评标方法及其应用研究,F284
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com
|