学位论文 > 优秀研究生学位论文题录展示

基于社会标注的主题分类及排序优化方法研究

作 者: 夏静
导 师: 文坤梅
学 校: 华中科技大学
专 业: 计算机应用技术
关键词: 学术检索 主题分类 排序方法 社会标注 优化
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 33次
引 用: 0次
阅 读: 论文下载
 

内容摘要


伴随着Web2.0概念对信息技术的影响,网络更注重与用户的交互。社会标注正是用户与网络交互而产生的新兴网络数据。而用户利用社会标注的主要目的是对其感兴趣资源进行描述,来提高分类、检索和发现网络资源的效率。在学术领域中,由于学术用户的专业性,该领域中的社会标注相比通用领域具有更强的准确性。在学术检索中,学术资源的主题类别信息可以从一定程度上指导用户的检索,帮助用户快速发现其感兴趣的学术资源。主题类别信息还可以融入到检索系统中,用于初始结果的主题过滤,可在一定程度上改进结果排序的效果。与此同时,在任何一个检索系统中,相关度排序是提高检索结果质量的关键技术之一。以学术检索为平台,基于社会标注的主题分类方法主要是利用学术会议的社会标注作为补充的数据源,连同会议的内容共同来构建会议的表示模型,基于会议的表示模型,利用朴素贝叶斯分类算法思想对会议进行主题分类。基于社会标注的排序优化方法的主要思想是,在基于“查询-内容”的初始排序策略中,融入“查询-标注”相关性的排序策略,以优化学术检索排序方法。因此,随着学术领域中社会标注的涌现和标注数量的增加,将基于社会标注的主题分类和排序优化方法应用于学术检索系统中,以优化检索结果的质量。将学术领域中的社会标注这一新型的网络资源属性信息,融入到学术检索中,达到改进学术检索结果质量的目的。并通过与其他方法的对比实验,验证了社会标注对于主题分类和排序方法的优化作用。

全文目录


摘要  4-5
Abstract  5-9
1 绪论  9-17
  1.1 课题研究背景  9-10
  1.2 课题研究的目的和意义  10-11
  1.3 国内外相关技术发展现状  11-15
  1.4 论文的主要研究内容  15
  1.5 全文结构  15-17
2 相关理论知识介绍  17-22
  2.1 朴素贝叶斯分类方法介绍  17-19
  2.2 互信息特征选择方法介绍  19-20
  2.3 语言模型介绍  20-21
  2.4 本章小结  21-22
3 基于社会标注主题分类方法  22-35
  3.1 主题分类总体方法设计  22-25
  3.2 训练样本集选取设计  25-27
  3.3 学术会议的表示模型构建  27-32
  3.4 基于社会标注的主题分类  32-34
  3.5 本章小结  34-35
4 基于社会标注的排序优化方法  35-45
  4.1 排序优化总体方法设计  35-38
  4.2 社会标注的语言模型构建  38-40
  4.3 查询-标注相关性计算  40-42
  4.4 基于社会标注的排序优化方法  42-44
  4.5 本章小结  44-45
5 实验与性能分析  45-61
  5.1 系统平台  45-46
  5.2 学术会议检索系统框架  46-48
  5.3 实验与分析  48-60
  5.4 本章小结  60-61
6 总结与展望  61-63
  6.1 全文总结  61-62
  6.2 进一步的研究方向  62-63
致谢  63-64
参考文献  64-69
附录1 攻读硕士学位期间参与项目  69-70
附录2 攻读硕士学位期间研究成果  70

相似论文

  1. 超声波钎焊填缝及钎缝优化工艺研究,TG454
  2. 曲拉精制干酪素褐变因素及工艺优化研究,TS252.5
  3. 压气机优化平台建立与跨音速压气机气动优化设计,TH45
  4. 常温低温组合密封结构的有限元分析与优化设计,TH136
  5. 涡轮S2流面正问题气动优化设计研究,V235.11
  6. 基于蚁群算法的电梯群优化控制研究,TU857
  7. 中心回燃式燃烧室燃烧特性研究,TK223.21
  8. 内置式高效永磁同步电机的设计研究,TM341
  9. 内点法在大型电力系统无功优化中的应用研究,TM714.3
  10. 轴向磁通感应子式高温超导电机的基础研究,TM37
  11. AVS视频解码器在PC平台上的优化及场解码的改善,TN919.81
  12. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  13. AES算法及其DSP实现,TN918.1
  14. 多层卫星网络稳定性设计研究,TN927.23
  15. 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
  16. 海量多数据库集成系统的查询处理研究,TP311.13
  17. 米曲霉FS-1脂肪酶发酵优化、分离纯化与酶学特性的研究,TQ925.6
  18. 大红山铁矿井下人员跟踪定位系统的优化研究,TN929.5
  19. 基于粒子群算法求曲线/曲面间最小距离方法,O182
  20. 番禺区初中语文新诗教学现状及其优化策略,G633.3
  21. 山野菜石参营养成分与品质分析,S647

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com