学位论文 > 优秀研究生学位论文题录展示
适用于高校学院级办公系统的推荐技术的研究
作 者: 蒋莎
导 师: 徐世中
学 校: 电子科技大学
专 业: 通信与信息系统
关键词: 推荐系统 中文分词 向量空间 相似性
分类号: TP391.3
类 型: 硕士论文
年 份: 2013年
下 载: 2次
引 用: 0次
阅 读: 论文下载
内容摘要
在我国的各大高校中,学院级办公系统的建立、运行和维护对于整个学院正常教学科研及管理工作的展开有着重要的意义。伴随人数的上升和办学性质的多样化,办公室里需要处理的数据和信息也越来越繁杂,使用人工配置的方法越来越难以完成预期的任务,因此怎样合理高效地配置及优化教学资源是办公系统中的一项关键技术。通过设计自动化的推荐系统,有助于有效优化配置教学资源,为用户提供适当的所需的资源。本文在此背景下,设计并实现了一个用于学院级文档信息个性化推荐的系统,针对学院信息资源的现状和不同用户的具体需求,采用一套行之有效的解决方案,对搜集的不同的信息进行自动分类,代替用户评估它从未看过的内容,以实现信息资源的个性化推荐与分配。本文的主要内容有:1、研究了文档信息的词汇切分方法,在分析和比较现有方法的优缺点基础上提出了基于词典和基于词频统计相结合的切分方法。在已有词典的基础上生成有向无环图,用动态规划的方法寻找切分概率最大的分法作为系统输出。这种方法性能良好,对于未被词典收录的词语也能进行相对准确的切分。2、讨论了资源与用户之间相似度的计算方法,通过建立向量空间模型,分析用户和资源的各项属性,提出一套行之有效的算法将资源与用户抽象成空间中的一系列向量。通过计算用户向量和资源向量之间的相似度来模拟资源与用户之间的相似程度。3、讨论了如何实现信息资源的个性化推荐。介绍了推荐系统的基本情况和目前的发展状况,介绍了本文设计的推荐系统的总结构以及现有的三种主要推荐系统。针对学院办公的需求,结合前两种推荐系统的优缺点,重点分析了适用于解决目前所面临问题的混合推荐算法,给出了算法的实现步骤及实验结果,最后分析了推荐算法的准确性。
|
全文目录
摘要 5-6 ABSTRACT 6-12 第一章 绪论 12-24 1.1 主要问题及其研究现状 12-21 1.1.1 个性化推荐系统与相关研究 14-16 1.1.1.1 协同过滤系统 14-15 1.1.1.2 基于内容的推荐系统 15 1.1.1.3 混合推荐算法 15-16 1.1.2 中文文档分词技术 16-18 1.1.2.1 基于字典的分词法 17 1.1.2.2 基于词的频度统计的分词方法 17-18 1.1.2.3 基于知识理解的分词方法 18 1.1.3 加权技术与相似度计算 18-21 1.1.3.1 加权技术 18-19 1.1.3.2 相似度计算 19 1.1.3.3 向量距离和相似系数计算 19-21 1.2 本文主要工作 21-22 1.3 本论文的结构安排 22-24 第二章 推荐系统的构架 24-32 2.1 系统的基本模块 24-25 2.2 系统功能概述 25-31 2.2.1 信息收集 25-27 2.2.1.1 属性分类 26 2.2.1.2 空间向量建立 26 2.2.1.3 文档分词 26-27 2.2.2 模型分析 27-29 2.2.2.1 模型建立 27-28 2.2.2.2 模型分析 28-29 2.2.3 推荐算法 29-31 2.2.3.1 算法选择 29-30 2.2.3.2 混合推荐算法 30-31 2.3 本章小结 31-32 第三章 系统信息收集与中文分词的实现 32-44 3.1 信息收集 32-35 3.1.1 通用推荐系统的信息收集方式 32 3.1.2 本文的信息收集方式 32-35 3.2 中文分词 35-43 3.2.1 概率语言模型分词 36-37 3.2.2 文档分词的实现 37-43 3.2.2.1 生成 Trie 树与有向无环图 38-40 3.2.2.2 查找最大切分组合 40-42 3.2.2.3 新词汇切分 42-43 3.3 本章小结 43-44 第四章 模型分析模块的实现 44-54 4.1 模型建立 45-51 4.1.1 用户模型 45-46 4.1.2 关键词模型 46-49 4.1.2.1 关键词频率计算 47-48 4.1.2.2 关键词模型建立 48-49 4.1.3 文档模型 49-51 4.1.3.1 文档向量生成 50 4.1.3.2 文档模型的建立 50-51 4.2 相似性计算 51 4.2.1 余弦相似度 51 4.3 计算结果分析 51-53 4.3.1 测试数据 52 4.3.2 测试结果 52-53 4.4 本章小结 53-54 第五章 推荐模块的实现 54-72 5.1 推荐算法选择 54-55 5.2 推荐算法的整体框架 55-63 5.2.1 算法的各阶段描述 57-62 5.2.2 混合推荐的完整过程 62-63 5.3 算法实验结果与比较 63-71 5.3.1 数据源和评价标准 63-64 5.3.1.1 基于推荐排名统计的评价标准 63-64 5.3.1.2 统计平均误差 64 5.3.2 与往年分配效果对比 64-66 5.3.3 不同推荐方式效果分析 66-71 5.3.3.1 平均推荐效果分析 66-68 5.3.3.2 单个用户推荐效果分析 68-71 5.4 本章小结 71-72 第六章 结论 72-73 6.1 总结 72 6.2 展望 72-73 致谢 73-74 参考文献 74-76
|
相似论文
- 基于停用词处理的汉语语音检索方法,TP391.1
- 基于行为特征的IRC僵尸网络检测方法研究,TP393.08
- 平顶山烤烟综合质量评价及与美国烤烟的对比分析,S572
- 旅游对芦芽山国家级自然保护区典型植被的影响,S759.9
- 基于论文关键词聚类的用户兴趣模型细化方法研究,TP391.3
- 基于图的科技文献相似性搜索关键技术研究,TP391.3
- 基于模糊聚类的图像检索方法研究及其系统实现,TP391.41
- 基于自然遗忘的个性化推荐算法研究,TP311.52
- 基于大众标注的个性化推荐系统研究,TP393.09
- 协同过滤推荐系统中关键问题研究与实现,TP311.52
- 能力导向终身学习个性化推荐系统学习者模型构建,G720
- 基于Markov模型的昆虫杆状病毒基因组的进化研究,Q939.4
- 终身学习个性化推荐系统中学习者个人能力发展研究,G77
- 全文检索及相关技术研究,TP391.3
- LUCENE中文分词在科研文档全文检索系统的应用研究,TP311.52
- 基于条件随机场的中文分词技术的研究与实现,TP391.1
- 利用非局部相似性的图像超分辨率重建研究,TP391.41
- 主观题自动评分技术研究,TP391.1
- 基于相似性测量检测图像型垃圾邮件技术的研究,TP393.098
- 复杂网络中的社团发现算法研究,TP301.6
- 实时移动路线推荐系统的研究与实现,TP391.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|