学位论文 > 优秀研究生学位论文题录展示
面向网络舆情监控的热点话题发现技术研究
作 者: 殷风景
导 师: 肖卫东
学 校: 国防科学技术大学
专 业: 管理科学与工程
关键词: 网络舆情 话题发现 热点发现 聚类
分类号: TP393.09
类 型: 硕士论文
年 份: 2010年
下 载: 749次
引 用: 6次
阅 读: 论文下载
内容摘要
随着国家、企业对网络舆情的日益重视,越来越多的网络舆情监控系统被开发出来帮助政府、部门或企业应对在网络上爆发的关于自己的舆论压力或群体性事件。在使用门槛很低、信息披露很容易、传播很快、影响很大的互联网环境下,监控系统实时采集相关信息,智能分析信息内容,及时发现舆情危情,为自动化解决监看、处理网络舆情提供了很好的支持,极大地方便了用户,有力地辅助用户及时正确地处理舆情危情。在大部分舆情监控的系统中,用户通过定制来源网站等信息让系统周期性地采集网站报道,经系统分析处理后将用户关心的报道呈现出来。在这个过程中,大量重复的或者描述同一事件的报道杂乱地出现在显示结果中,既不利于用户的查看、分析、总结,也不利于系统评价事件的报道详情、准确计算事件的热度,因而需要运用话题发现技术对这一问题进行改善。本文首先研究了话题发现的关键技术,在分析话题发现流程后得出聚类是其中的关键步骤的结论,因此,接下来阐述了各种聚类算法的原理并以此为基础分析对比了各算法的利弊,最终选取了在话题发现的评测中使用最多的single-pass算法,然后分析了该算法从评测走向实际应用遇到的困难和制约因素,本文中从算法响应速度、聚类精度和用户介入等角度着手改进single-pass聚类算法,最终取得了良好的实际应用效果,达成了话题发现的目标。接下来针对舆情监控的特定应用,研究热点发现的话题热度评价方法,在已有基于关注度的热度指标基础上,本文提出基于关注度和影响能力的综合热度指标,更加准确地契合舆情危情发现的目标,经过热度排序后的话题直观简洁地向用户推荐了舆情监控的急缓先后顺序,使用户可以更好地应对复杂多变的网络环境。通过在舆情监控系统中整合话题发现技术和热点发现技术形成有机统一的热点话题发现模型,具有较高的应用价值;同时,虽然话题发现技术和热点发现技术的研究比较成熟,但技术的实用化过程中遇到很多问题严重制约了技术的效果,所以在舆情监控系统中建立热点话题发现模型也具有较高的研究意义和研究价值。文章最后通过运行实例和对比分析验证了模型的可行性和有效性。
|
全文目录
摘要 8-9 ABSTRACT 9-11 第一章 绪论 11-27 1.1 研究背景和问题 11-15 1.2 国内外研究现状和发展趋势 15-24 1.2.1 国内外研究现状 15-22 1.2.2 发展趋势 22-24 1.3 本文主要研究工作 24-26 1.4 本文的组织结构 26-27 第二章 话题自动发现的关键技术研究 27-43 2.1 话题自动发现的流程 27-30 2.2 话题发现的文本聚类算法 30-34 2.2.1 经典single-pass 算法 30-31 2.2.2 基于划分的聚类算法 31 2.2.3 基于层次的聚类算法 31-32 2.2.4 基于密度的聚类算法 32-33 2.2.5 基于网格的聚类算法 33-34 2.3 各聚类算法的比较与选取 34-36 2.3.1 聚类算法比较的标准 34 2.3.2 各聚类算法的比较 34-36 2.4 影响话题发现技术实用化的因素分析 36-38 2.5 对经典single-pass 算法的改进 38-42 2.5.1 基于词性标注的特征词筛选 38-39 2.5.2 文本正文与标题的双向量表示 39-40 2.5.3 “代”的引入和偏离点调整 40-42 2.6 本章小结 42-43 第三章 话题的热度评价指标研究. 43-52 3.1 话题的热度 43-45 3.2 基于关注度的热度指标的研究 45-47 3.3 话题热度与话题热度指数 47-48 3.4 综合热度指标体系 48-51 3.4.1 话题的关注度 48-49 3.4.2 话题的影响能力 49-51 3.5 本章小结 51-52 第四章 热点话题发现模型的设计与分析 52-59 4.1 热点话题发现模型设计 52-57 4.1.1 模型功能设计 52-54 4.1.2 模型结构设计 54-55 4.1.3 模型的数据流 55-57 4.2 热点话题发现模型分析 57-58 4.3 本章小结 58-59 第五章 热点话题发现模型的实例分析 59-73 5.1 热点话题发现模型的应用实例 59-65 5.1.1 网络舆情监控系统简介 59-61 5.1.2 热点话题发现模型的运行实例 61-65 5.2 聚类性能对比和热点验证 65-71 5.2.1 话题发现的聚类性能对比 65-68 5.2.2 话题热度的验证 68-71 5.3 本章小结 71-73 第六章 结论 73-75 6.1 主要工作与创新点 73-74 6.2 进一步研究工作 74-75 致谢 75-76 参考文献 76-80 作者在学期间取得的学术成果 80-81 附录A 热点话题发现模型结果列表(前54 位) 81-83 附录B 话题发现的数据集及聚类结果列表. 83-85
|
相似论文
- 隐式用户兴趣挖掘的研究与实现,TP311.13
- 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
- 高血压前期证候特征研究,R259
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- K-均值聚类算法的研究与改进,TP311.13
- 大学生综合素质测评研究,G645.5
- 21个荷花品种遗传多样性的ISSR分析,S682.32
- 基于聚类分析的P2P流量识别算法的研究,TP393.02
- 桃杂交后代(F1)幼苗光合效能评价,S662.1
- 南通市农业面源污染负荷研究与综合评价,X592
- 土壤环境功能区划研究,X321
- 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
- 大豆杂种优势及其遗传基础研究,S565.1
- 细菌聚类算法及其在图像分割问题中的研究与应用,TP391.41
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 中国区域性网上社区的舆情研究,G206
- 基于同化能力杂种优势早期评价的桃光合特性研究,S662.1
- 演化聚类算法及其应用研究,TP311.13
- 基于机器视觉的车辆检测和车距测量方法研究,TP274
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com
|