学位论文 > 优秀研究生学位论文题录展示

话题追踪与演化分析技术研究

作 者: 吕楠
导 师: 罗军勇
学 校: 解放军信息工程大学
专 业: 计算机软件与理论
关键词: 文本信息处理 话题追踪 话题结构模型 事件演化 子话题 时间片
分类号: TP393.08
类 型: 硕士论文
年 份: 2009年
下 载: 126次
引 用: 0次
阅 读: 论文下载
 

内容摘要


话题追踪与演化分析技术旨在将用户关注的话题以最直观的方式呈现出来,使得用户方便的对话题的来龙去脉有一个全面的了解,在军事和民用方面都具有重要的理论价值和现实意义。本文主要研究话题追踪技术,话题演化分析技术及话题中的事件发现与关系分析技术,取得了如下四个方面的研究成果:(1)目前的话题追踪与演化分析算法将话题看作是单一的新闻报道的集合,没有考虑到话题的内部结构。本文通过分析话题内部各要素的关系,同时考虑到话题追踪与演化分析任务的时序性,建立了话题结构模型。为话题追踪与演化分析奠定了模型基础。(2)针对话题的偏移问题,提出了一种基于子话题反馈的话题追踪算法。该算法利用新事件检测的思想进行时间片划分,根据话题的偏移及时地修改话题向量。实验表明,该算法能够有效的适应话题偏移,与传统算法相比提高了话题追踪的召回率。(3)话题追踪无法分析、表示话题的演化历程,针对这个问题,结合BLOG社团演化分析的思想,提出了基于子话题相似度的话题演化分析算法。实验表明该算法可以准确的展示出话题的发展演化历程。(4)根据话题结构模型,结合时序文本挖掘的思想,提出了一种基于子话题整合的事件发现算法,并在此基础上改进了事件演化分析算法。该算法充分考虑了话题的内部结构特征,实验证明了算法的有效性。论文最后给出了话题追踪与演化分析原型系统的设计与实现细节。并对本文工作进行了总结,对今后的工作做了进一步的展望。

全文目录


表目录  6-7
图目录  7-8
摘要  8-9
ABSTRACT  9-10
第一章 引言  10-15
  1.1 课题背景及意义  10-11
  1.2 话题追踪与演化技术发展现状  11-13
    1.2.1 相关概念  11
    1.2.2 话题追踪与演化分析技术发展现状  11-13
  1.3 话题追踪与演化分析流程  13-14
  1.4 论文的主要贡献和结构安排  14-15
第二章 话题结构模型  15-21
  2.1 话题层次结构分析  15-16
  2.2 话题结构模型的建立  16-19
  2.3 基于话题结构模型的话题追踪与演化分析  19-20
  2.4 本章小结  20-21
第三章 一种基于子话题反馈的话题追踪算法  21-32
  3.1 基于子话题反馈的话题追踪流程  21-22
  3.2 文本信息处理相关技术  22-24
  3.3 基于子话题反馈的话题追踪算法  24-29
    3.3.1 子话题发现算法  25-27
    3.3.2 基于新事件检测的时间片划分算法  27-28
    3.3.3 基于子话题反馈的话题追踪算法  28-29
  3.4 实验结果及性能分析  29-31
    3.4.1 实验数据及测试方法  29-30
    3.4.2 实验结果评价标准  30
    3.4.3 实验结果与性能分析  30-31
  3.5 本章小结  31-32
第四章 一种基于子话题相似度的话题演化分析算法  32-38
  4.1 话题演化概述  32-33
  4.2 基于子话题相似度的话题演化分析算法  33-35
    4.2.1 算法思想  33-34
    4.2.2 算法描述  34-35
  4.3 实验及结果分析  35-37
    4.3.1 实验数据  35-36
    4.3.2 实验结果与性能分析  36-37
  4.4 本章小结  37-38
第五章 一种基于事件多向量模型的事件演化分析算法  38-46
  5.1 事件模型的建立  38-40
  5.2 基于子话题整合的事件发现算法  40-42
    5.2.1 算法思想  41
    5.2.2 算法描述  41-42
  5.3 事件演化分析算法  42-43
    5.3.1 事件的表示与属性的提取  42
    5.3.2 算法思想  42-43
    5.3.3 算法描述  43
  5.4 实验及结果分析  43-45
  5.5 本章小结  45-46
第六章 话题追踪演化原型系统的设计与实现  46-55
  6.1 系统设计框架  46-47
  6.2 原型系统设计  47-51
    6.2.1 数据库设计  47-48
    6.2.2 模块框架设计  48-51
  6.3 实现结果  51-54
    6.3.1 Web信息采集模块实现  51-52
    6.3.2 话题追踪模块实现  52-53
    6.3.3 话题演化分析模块实现  53
    6.3.4 事件演化分析模块实现  53-54
  6.4 本章小结  54-55
结束语  55-57
参考文献  57-62
作者攻读硕士学位期间完成的主要工作  62-63
致谢  63

相似论文

  1. 大连市G区群体性事件应急处置研究,D631.4
  2. DRP系统故障自愈时间的建模分析与优化研究,TP393.04
  3. 微博客话题追踪及实时检索的相关研究,TP393.092
  4. 晶振自动粗精磨机的研究和开发,TG580.2
  5. 航空公司飞机智能化排班问题的研究,F560
  6. 基于互联网数据的话题发现及追踪技术研究与实现,TP391.3
  7. 实时系统调度算法的抢占控制模型及其遗传算法实现,TP316.2
  8. 汽车集成BCM嵌入式系统的研究与设计,TP368.1
  9. 实时操作系统μC/OS-Ⅱ任务调度机制的分析与改进,TP316.2
  10. 网络舆情分析关键技术的研究与实现,TP393.09
  11. 自适应音频感知的虚拟机调度的研究,TP302
  12. 群体性突发事件演化机理研究,C912.68
  13. 基于晶振粗精磨机的单片机实时多任务处理系统模式研究,TP368.12
  14. 基于博客的网络话题发现及追踪的研究,TP391.1
  15. 系统级动态热管理关键技术研究,TP332
  16. 群体性事件演化机理视阈下的新闻报道缺陷与对策,D631.4
  17. OBS边缘节点调度模块硬件设计与实现,TN929.1
  18. 基于DSP的摊铺机自动找平控制系统研究,U415
  19. 基于对象的嵌入式实时操作系统,TP316.2
  20. 面向话题追踪的特征选取与文本表示技术的研究,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络安全
© 2012 www.xueweilunwen.com