学位论文 > 优秀研究生学位论文题录展示
网络舆情分析关键技术的研究与实现
作 者: 许志凯
导 师: 王宇颖
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 网络舆情分析 话题检测 话题追踪 热点话题识别
分类号: TP393.09
类 型: 硕士论文
年 份: 2011年
下 载: 198次
引 用: 0次
阅 读: 论文下载
内容摘要
互联网因其时效性强、交互性好等特点,已经成为人们日常获取信息的重要途径,互联网因此具有了巨大的引导舆论、影响受众的能力,网络舆情已经成为社会舆情的重要组成部分,对社会的影响力越来越大。由于互联网虚拟性、随意性、交互性、及时性的特点,网络舆情具有一些传统社会舆情所不具备的特点,如直接性、突发性、偏差性等,而互联网上信息量巨大,难以通过人工及时准确的发现网络上的舆情信息,正是在这种需求的驱动下,网络舆情分析引起了越来越多研究者的关注,成为当前信息处理领域的热点问题。本文首先分析了网络舆情分析在国内外的研究现状,介绍了网络舆情分析相关的理论,然后在此基础上对网络舆情分析的关键技术展开了研究,本文的研究工作主要包括以下五个方面:(1)在调研了各种新闻表示模型的基础上,采用向量空间模型作为新闻表示模型,并通过实验测试了词向量维度对话题检测准确率和所需时间的影响。(2)提出了面向海量互联网新闻时话题检测中聚类算法的选择策略,在调研了主要的聚类算法的基础上,采用了基于BIRCH算法的话题检测模型,并通过实验证明了采用该模型能够很好的检测到互联网上的话题。(3)提出了一个基于多维特征的话题追踪模型,当所有的特征都满足阈值要求时,才认为两个话题是同一话题,该模型能够很好的区分相似与相同的话题。(4)对热点话题的特征、发展周期进行了分析,对热点话题的计算进行了研究,通过实验证明了本文中的热点话题计算方法可以有效的分析出当前互联网上的热点话题。(5)在上述研究工作的基础上设计并完整实现了网络舆情分析系统,该系统可以发现反映网络舆情的热点话题,达到了实用的程度,进一步验证了上述方法的有效性。
|
全文目录
摘要 4-5 Abstract 5-8 第1章 绪论 8-12 1.1 课题研究的背景及意义 8-9 1.2 舆情分析的国内外研究现状和分析 9-10 1.3 本文的主要工作及内容安排 10-12 第2章 网络舆情分析基础知识 12-22 2.1 引言 12 2.2 TDT 基础知识 12-14 2.2.1 TDT 的发展历程 12-13 2.2.2 TDT 中的基本概念与任务定义 13-14 2.2.3 TDT 的评价 14 2.3 信息检索基础知识 14-20 2.3.1 信息检索中的关键技术 15-19 2.3.2 信息检索系统评价 19-20 2.4 本章小结 20-22 第3章 网络舆情分析关键技术的研究 22-43 3.1 引言 22 3.2 新闻文本表示 22-25 3.2.1 新闻表示模型选择 22-23 3.2.2 特征项权重计算 23-24 3.2.3 特征维数约减 24-25 3.3 话题检测 25-32 3.3.1 话题检测算法 26-28 3.3.2 基于BIRCH 算法的话题检测模型 28-30 3.3.3 话题检测实验 30-32 3.4 话题追踪 32-38 3.4.1 话题质心 32-33 3.4.2 话题质心的修正 33-34 3.4.3 基于多维特征的话题追踪模型 34-36 3.4.4 话题追踪实验 36-38 3.5 热点话题分析 38-41 3.5.1 热点话题特征分析 38-39 3.5.2 话题热度度量 39-40 3.5.3 热点话题分析实验 40-41 3.6 本章小结 41-43 第4章 网络舆情分析系统的设计与实现 43-51 4.1 引言 43 4.2 系统框架结构 43-48 4.2.1 数据层 44-46 4.2.2 话题层 46-47 4.2.3 分析层 47-48 4.2.4 用户层 48 4.3 系统功能说明 48-49 4.4 本章小结 49-51 结论 51-53 参考文献 53-57 攻读学位期间发表的学术论文 57-59 致谢 59
|
相似论文
- 微博客话题追踪及实时检索的相关研究,TP393.092
- 网络舆情数据获取与话题分析技术研究,TP393.09
- 互联网新闻热点挖掘系统的研究与实现,TP393.09
- 话题追踪与演化分析技术研究,TP393.08
- 网络中文事件自动检测技术研究,TP393.09
- 基于互联网数据的话题发现及追踪技术研究与实现,TP391.3
- 基于话题检测与跟踪的话题搜索技术研究,TP391.3
- 基于社会网络分析的网络舆情研究,TP393.09
- 基于博客的网络话题发现及追踪的研究,TP391.1
- 基于容错粗糙集的话题检测与跟踪方法研究,TP391.1
- 基于网络研判的高校群体突发事件预警平台的研究,TP311.52
- 话题检测与跟踪算法的研究,TP391.1
- 中文Blog热门话题检测与跟踪技术研究,TP393.09
- 面向话题追踪的特征选取与文本表示技术的研究,TP391.1
- 新闻话题表示模型和关联追踪技术研究,TP391.1
- 基于内容分析的Blog话题检测方法研究,TP393.092
- 文本聚类在话题检测与人名消歧中的应用研究,TP391.1
- 网络舆论传播中若干算法的研究,TP301.6
- 基于系统相似模型与持续时间的话题检测技术研究,TP391.1
- 基于内容的互联网舆情信息挖掘关键技术研究,TP393.09
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com
|