学位论文 > 优秀研究生学位论文题录展示
基于聚焦爬虫技术的教学资源搜集与自动整理方法研究
作 者: 陈永彬
导 师: 张琢
学 校: 东北师范大学
专 业: 计算机软件与理论
关键词: 教学资源库 网络教学资源 方法 聚焦爬虫 分类 聚类
分类号: TP301.6
类 型: 硕士论文
年 份: 2011年
下 载: 25次
引 用: 0次
阅 读: 论文下载
内容摘要
随着因特网的爆炸性增长,网络上的教学资源越来越丰富,而迅速发展的信息化教育,也使得教学资源库的建设越来越受到人们重视。一个内容丰富且结构良好的教学资源库不仅可以有效地提高教学质量,促进教学改革,而且可以满足现代办学的需要,将信息技术和教学实践有效结合,对各学科宝贵的教学资源进行有效组织、整理和共享,从而降低办学成本,提高办学效益,同时也是培养创新型人才的有效举措,教师和学生可以不受时空限制,获取国内外相关领域的最前沿知识和信息,取得创造性的学习效果。但是目前的教学资源库建设也存在一些问题:库中资源内容还不够丰富、资源库本身组织混乱等等,而信息技术的迅猛发展为解决这些问题提供了可能,所以研究如何利用现有的信息技术为教学资源库的建设服务,成为一个很重要的课题。本论文在分析了现有资源库建设的现状和介绍相关的信息技术基础上,提出了一整套利用现有信息技术为教学资源库建设服务的方法流程,并针对该方法的前两部分内容分别做了相关的研究:首先对用来采集网络特定主题信息的聚焦爬虫,提出了利用蚁群算法来指导其搜索策略——ACO-FC,并通过实验证明了提出的方法的有效性,为更好地获取网络上丰富的学习资源提供了保障。其次,针对采集下来的网络学习资源,通过对粒子群算法(PSO)和K-均值算法(K-means)的分析,提出了一种改进的混合聚类算法——ISPO+K-means,与其它几种算法相比,实验结果表明新算法聚类效果更好,这样就能够对采集下来的学习资源进行自动整理,减少人工劳动,提高工作效率。本文旨在找到一套利用现有信息技术服务于教学资源库建设的方法,希望为教学资源库建设相关方面研究提供一些有益的参考。
|
全文目录
中文摘要 4-5 英文摘要 5-6 目录 6-8 第1章 绪论 8-13 1.1 研究背景和意义 8 1.2 国内外研究现状 8-11 1.3 研究目标和主要内容 11-12 1.4 论文的组织结构 12-13 第2章 资源搜集与整理相关知识与技术 13-21 2.1 搜索引擎概述 13-15 2.1.1 搜索引擎的发展和分类 13-14 2.1.2 搜索引擎的工作原理 14-15 2.2 聚焦爬虫技术 15-18 2.2.1 主题式搜索引擎 15-16 2.2.2 聚焦爬虫特点 16 2.2.3 聚焦爬虫的工作流程 16-17 2.2.4 聚焦爬虫的体系结构 17-18 2.3 自动整理技术 18-20 2.3.1 自动分类 18-19 2.3.2 自动聚类 19-20 2.3.3 数据抽取 20 2.4 本章小结 20-21 第3章 资源的自动搜集与整理方法研究 21-27 3.1 搜集与自动整理模型 21-22 3.2 基于蚁群算法的聚焦爬虫 22-24 3.3 自动聚类 24 3.4 数据抽取 24-26 3.5 结构化资源库引擎 26 3.6 结构化教学资源库 26 3.7 本章小结 26-27 第4章 聚焦爬虫技术的方法研究 27-35 4.1 Web 页面主题特征分布 27 4.2 基于蚁群算法的聚焦爬虫搜索策略 27-33 4.2.1 蚁群算法(ACO) 28-29 4.2.2 ACO-FC 原理 29-30 4.2.3 ACO-FC 模型 30-31 4.2.4 ACO-FC 流程 31-32 4.2.5 ACO-FC 参数分析 32-33 4.3 ACO-FC 实验设计 33 4.4 ACO-FC 实验结果分析 33-34 4.5 本章小结 34-35 第5章 自动整理技术的方法研究 35-44 5.1 粒子群算法 35-36 5.2 智能单粒子算法 36-38 5.3 K-means 算法 38 5.4 基于智能单粒子算法的改进混合聚类算法 38-40 5.4.1 ISPO+K-means 算法思想 38-39 5.4.2 ISPO+K-means 算法编码与适应度函数 39 5.4.3 ISPO+K-means 算法详细描述 39-40 5.5 ISPO+K-means 算法实验设计 40 5.6 ISPO+K-means 算法实验结果分析 40-42 5.7 本章小结 42-44 第6章 总结与展望 44-46 6.1 主要工作和创新 44 6.2 进一步研究的建议 44-46 参考文献 46-49 致谢 49-50 攻读硕士学位期间发表(录用)的论文 50
|
相似论文
- K公司计划及预测改进对于合理库存配置的研究,F224
- 自变量分段连续型随机微分方程数值解的收敛性及稳定性,O211.63
- 谐波齿轮传动柔轮应力及轮齿磨损分析,TH132.43
- 三轴稳定卫星姿态控制方法研究,V448.22
- 半球谐振陀螺误差分析与测试方法设计,V241.5
- 航天器姿态动力学系统鲁棒自适应控制方法研究,V448.22
- 无尾飞翼式飞行器主动控制的参数化方法,V249.1
- 半透明材料辐射与相变耦合换热研究,V259
- 多导弹协同作战突防效能评估及组合优化算法研究,TJ760.1
- 基于DSP的任意次谐波发生器的设计,TM935
- 高中信息技术新课程评价方法的实施研究,G633.67
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 基于词义及语义分析的问答技术研究,TP391.1
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 基于串核的蛋白质分类算法的研究与实现,TP301.6
- 统计与语言学相结合的词对齐及相关融合策略研究,TP391.2
- 隐式用户兴趣挖掘的研究与实现,TP311.13
- 上下文相关的词汇复述研究,TP391.1
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 互联网上旅游评论的情感分析及其有用性研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法 > 算法理论
© 2012 www.xueweilunwen.com
|