学位论文 > 优秀研究生学位论文题录展示

网络社区舆情引导技术研究与实现

作 者: 邸文晨
导 师: 张伟哲
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 网络舆情 舆情引导 信息采集 话语复述 验证码识别
分类号: TP393.092
类 型: 硕士论文
年 份: 2012年
下 载: 86次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着计算机的普及,网络进入了高速发展的阶段,逐步成为了人们生活中的一部分。人们获取信息的方式也逐渐从广播、电视、报纸转移到了网络。通过网络社区,民众可以表达情绪、态度、意见、要求,这样众多舆论的汇总形成了网络社区的舆情,网络已经成为舆论活动的主要阵地。目前采用人工发布信息的手段来对网络社区进行舆情的引导,需要大量的人力物力,已经不能够满足现实的需要。因此网络舆情引导,已经成为了学术界研究的热点。论文从网络舆情引导中用到的技术角度出发,提出了针对网络社区舆情引导的技术解决方案,设计了一个舆情引导系统。论文中,将对网络社区舆情引导中涉及到的主要关键技术:多通道信息采集、话语复述及网络社区信息自动发布展开详细的讨论。首先,多通道信息采集部分针对不同类型的网站进行信息采集,分为四个采集通道:主流媒体网站通道、博客通道、论坛BBS通道以及微博通道。前三个在尽量保证底层爬虫架构不变动的情况下,通过配置不同的通道,达到信息采集的目的。微博通道则单独采用了开放API的接口来采集信息,保证了程序的稳定性。其次,文中利用同义词替换方法。先将在网络上抓取的语料进行分词,然后利用同义词词库,对分词后的语料进行同义词替换,得到意思相同的句子,构成新的语料库。再次,论文针对两类网络社区:论坛和微博,进行信息的自动发布。研究和实现了Windows平台下的网络社区信息发布系统,系统实现中采用了基于神经网络识别的图形验证码技术,利用WebBrowser控件解决了论坛的信息自动发布,利用微博开放API解决了微博的信息自动发布。最后,通过对系统的测试,根据研究结论所得出的方案,在一定程度上可以解决网络社区舆情引导的问题,具有一定的可行性,系统有一定的应用价值。

全文目录


摘要  4-5
Abstract  5-7
目录  7-10
第1章 绪论  10-19
  1.1 课题研究的背景和意义  10-13
    1.1.1 课题研究的背景  10-12
    1.1.2 课题简介  12
    1.1.3 课题研究的意义  12-13
  1.2 本文的主要研究内容  13-15
    1.2.1 多通道信息采集技术运用  13-14
    1.2.2 图形验证码识别  14
    1.2.3 话语复述  14-15
    1.2.4 网络社区发布技术运用  15
  1.3 国内外研究现状  15-18
    1.3.1 网页正文提取  15-16
    1.3.2 话语复述研究现状  16-17
    1.3.3 图形验证码识别的研究发展  17-18
  1.4 论文结构安排  18-19
第2章 多通道信息采集技术研究  19-34
  2.1 爬虫设计  19-22
    2.1.1 爬虫框架设计  19-20
    2.1.2 爬虫主要模块设计  20-22
    2.1.3 多通道爬虫设计  22
  2.2 网站通道内容采集  22-24
  2.3 博客通道内容采集  24-27
  2.4 BBS 通道内容采集  27-29
  2.5 微博通道内容采集  29-33
    2.5.1 OAUTH 认证  30-31
    2.5.2 微博通道信息采集设计  31-33
  2.6 本章小结  33-34
第3章 网络社区信息发布技术研究  34-52
  3.1 图形验证码识别技术  34-46
    3.1.1 预处理  34-40
    3.1.2 字符分割  40-42
    3.1.3 验证码识别  42-46
  3.2 话语复述技术  46-49
    3.2.1 逆向最大匹配算法  46-48
    3.2.2 同义词替换  48-49
  3.3 网络社区信息发布  49-51
  3.4 本章小结  51-52
第4章 网络社区舆情引导系统设计与实现  52-68
  4.1 系统总体结构设计  52-53
  4.2 模块实现  53-59
    4.2.1 精品语料采集模块  53-54
    4.2.2 小号语料采集模块  54-56
    4.2.3 虚拟人物培养模块  56-57
    4.2.4 话语复述模块  57
    4.2.5 虚拟人物舆论引导模块  57-58
    4.2.6 账号管理模块  58-59
    4.2.7 配置文件管理模块  59
  4.3 模块测试  59-64
    4.3.1 信息采集单机吞吐量实验  59-63
    4.3.2 图形验证码识别  63-64
  4.4 系统功能测试  64-67
    4.4.1 网络社区中帖子人工置顶测试  64-66
    4.4.2 人物影响力比较  66-67
  4.5 本章小结  67-68
结论  68-70
参考文献  70-75
攻读硕士学位期间发表的学术论文  75-77
致谢  77

相似论文

  1. 路面平整度检测系统中的数据采集和定位技术研究,U416.2
  2. 中国区域性网上社区的舆情研究,G206
  3. 网络舆情的形成机制研究,G206
  4. 网络新闻发言人制度构建,G219.2
  5. 网络群体性事件及应对策略研究,D630
  6. 网络舆情对刑事司法的影响及其应对,G206
  7. 网络舆情对政治生态环境的影响研究,G206
  8. 基于系统动力学的网络舆情应对问题分析,G206
  9. 用电信息采集一体化建设研究,F426.61
  10. 南涧县政府门户网站管理中心信息管理系统设计与实现,TP311.52
  11. 酒店无线数据信息采集管理系统的研究与开发,TP311.52
  12. 基于Agent的分布式元搜索引擎架构研究与实现,TP391.3
  13. WEB主题信息采集系统的设计与实现,TP274.2
  14. 基于网络舆情的企业危机管理研究,G206
  15. 微藻养殖信息采集与调控系统研究,S968.49
  16. 蓝牙技术在抄表系统中的应用,TM76
  17. 上市公司网络舆情管控研究,F276.6
  18. 社会焦点事件网络舆情演变研究,G206
  19. 网络舆情热点事件中的网民行为研究,G206
  20. 结直肠癌转化医学信息库构建与应用探索,R735.3
  21. 用电信息采集系统在智能电网发展中的建设应用,TM76

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com