学位论文 > 优秀研究生学位论文题录展示

网络信息提取系统关键技术研究

作 者: 唐微
导 师: 郭方芳
学 校: 大连理工大学
专 业: 计算数学
关键词: 细兴趣粒度 用户兴趣模型 隐式更新 兴趣漂移
分类号: TP393.09
类 型: 硕士论文
年 份: 2009年
下 载: 45次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着网络技术的飞速发展,网络改变了人们的生产、生活方式,成为人们获取信息的重要渠道。搜索引擎缓解了网络信息的广泛性与用户信息需求的特定性形成了尖锐的矛盾,但是由于搜索引擎智能化不足,不能满足用户的个性化需求。本文针对这个问题在个性化信息服务技术方面进行了一些探索和研究。本文首先使用显式和隐式收集方式相结合的方式收集用户的浏览内容和浏览行为,对收集到的网页进行处理之后,采用加入时间因素的细兴趣粒度表示法表示文本,并对文本进行聚类分析,以发现用户的兴趣。其次明确用户兴趣更新的必要性及考虑现有研究存在的问题后,在用户兴趣模型更新方法上,针对用户兴趣漂移,采用隐式更新的方法,应用混合兴趣更新方法对用户兴趣进行更新。在此基础上设计并实现了系统原型,验证文本聚类、兴趣漂移算法和网页兴趣度计算的有效性,最后验证了本文所设计的用户兴趣模型能够提高查全率和查准率,可以为用户提供更为精确有效的个性化推荐。

全文目录


摘要  4-5
Abstract  5-7
引言  7-10
1 个性化网络信息提取的研究现状及其支撑技术  10-17
  1.1 个性化数据挖掘的研究现状  10-12
    1.1.1 个性化信息提取的研究综述  10-11
    1.1.2 个性化信息提取系统存在的问题  11-12
  1.2 个性化信息提取研究的支撑技术  12-17
    1.2.1 兴趣模型理论与技术  12-15
    1.2.2 兴趣模型数据的收集与更新技术  15
    1.2.3 个性化信息提取评估标准  15-17
2 用户兴趣模型的建立及其更新  17-27
  2.1 用户兴趣模型的建立及其表示  17-26
    2.1.1 用户兴趣模型的建模  17-18
    2.1.2 用户兴趣模型的数据表示与存储  18-19
    2.1.3 用户网页特征提取  19-26
  2.2 用户浏览行为获取  26-27
3 用户兴趣度的量化与更新  27-36
  3.1 用户兴趣度的计算  27-32
  3.2 用户兴趣度的更新  32-36
4 原型系统的设计与实现  36-44
  4.1 系统设计  36-38
    4.1.1 数据库设计  36-38
    4.1.2 用户兴趣模型初始化  38
  4.2 系统实现与分析  38-44
    4.2.1 系统实现  38-39
    4.2.2 系统部分实验结果与分析  39-44
结论  44-45
参考文献  45-48
攻读硕士学位期间发表学术论文情况  48-49
致谢  49-51

相似论文

  1. 隐式用户兴趣挖掘的研究与实现,TP311.13
  2. 基于策略Agent的个性化信息检索系统的研究与实现,TP391.3
  3. 个性化医疗信息推荐系统的研究与实现,R319
  4. 基于Agent元搜索引擎的个性化研究,TP391.3
  5. 自适应教学科研信息推送服务模型研究,TP393.09
  6. 基于本体的个性化元搜索引擎研究,TP391.3
  7. RSS个性化信息服务的用户兴趣模型研究及应用,TP393.09
  8. 基于混合聚类的个性化搜索研究,TP391.3
  9. 基于浏览日志和浏览行为的用户兴趣模型研究,TP393.02
  10. 基于J2EE架构的个性化元搜索引擎的研究与设计,TP391.3
  11. 个性化信息检索中用户兴趣模型的研究,TP391.3
  12. 旅游多媒体信息主动服务系统研究,TP311.52
  13. 基于社会网络的用户兴趣模型研究,O242.1
  14. 中文搜索引擎的个性化服务研究,TP391.3
  15. 基于网页聚类的搜索引擎结果排序,TP391.3
  16. 基于本体的知识个性化协同推荐系统研究,G302
  17. 面向用户兴趣的校园网聚类搜索引擎的研究与实现,TP393.18
  18. 基于用户兴趣模型的校园网搜索引擎设计与应用,TP391.3
  19. 用户兴趣模型建模方法研究,TP311.13
  20. 区域教育信息化资源库更新服务研究,G434

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com