学位论文 > 优秀研究生学位论文题录展示

微博文本情感分类方法与应用研究

作 者: 康浩
导 师: 王晖
学 校: 国防科学技术大学
专 业: 控制科学与工程
关键词: 微博 情感分类 支持向量机 语义规则 预测
分类号: TP391.1
类 型: 硕士论文
年 份: 2012年
下 载: 117次
引 用: 0次
阅 读: 论文下载
 

内容摘要


微博作为非常流行的在线社会媒体,近年来发展迅速。人们可以通过微博发布博文、对他人的博文作出评论,从中可以对人物、事件等发表个人看法、交流彼此意见、给出正负评价。如何从这些博文或评论文本中快速区分出正面或负面情感信息,用来反映民众对真实公众人物或现实社会事件的观点或立场,是本文研究的出发点。而文本情感分类的目的正在于利用计算机代替人力完成情感文本的分类工作,是当前研究的一个热点,能够较好地达到上述目的。基于此,本文先后研究了微博文本情感分类的两种方法,并将情感分类方法应用于一个具体实例,通过分析微博文本的情感极性,用来反映公众人物的受欢迎程度。本课题组前期有针对性地采集了大量的微博文本数据,在此基础上,本文主要开展了如下研究:(1)针对微博文本的情感分类问题,研究了基于支持向量机的微博文本情感分类方法,主要包括情感词典的选择与扩充、文本情感特征选择、基于支持向量机的分类器训练与测试等内容;(2)针对所研究的基于支持向量机的文本情感分类方法不能较好地解决情感发散的问题,进一步研究了基于语义规则的文本情感分类方法,主要包括语义规则的归纳、情感模型的建立、情感极性值计算等;(3)针对微博文本中体现的情感类别可以反映出公众人物的受欢迎程度的问题,针对一个具体实例,研究验证了基于微博文本情感分类的预测问题。本文研究的两种微博文本情感分类方法,分类精度较好,分别达到73.83%和77.17%。将基于语义规则的分类方法应用到实例中对微博文本进行情感分类,而后进行分析预测,预测精度可观。

全文目录


摘要  9-10
ABSTRACT  10-11
第一章 绪论  11-17
  1.1 研究背景及意义  11-15
    1.1.1 研究背景  11-14
    1.1.2 研究意义  14-15
  1.2 面临挑战及研究内容  15-16
    1.2.1 面临挑战  15
    1.2.2 研究内容  15-16
  1.3 论文组织结构  16-17
第二章 文本情感分类研究现状及相关技术理论  17-23
  2.1 情感分类研究现状  17-19
    2.1.1 文本情感分类研究现状  17-18
    2.1.2 微博文本情感分类及应用研究现状  18-19
    2.1.3 研究现状分析与小结  19
  2.2 自然语言处理相关技术  19-20
    2.2.1 分词  20
    2.2.2 词性标注  20
    2.2.3 分词及词性标注工具介绍  20
  2.3 分类评价指标  20-22
    2.3.1 查全率与查准率  21
    2.3.2 Fβ测量值  21-22
  2.4 本章小结  22-23
第三章 基于支持向量机的微博文本情感分类方法研究  23-38
  3.1 支持向量机的基本原理  23-27
  3.2 基于支持向量机的微博文本情感分类流程  27-28
  3.3 微博文本的处理与表示  28-32
    3.3.1 文本繁简转化及用户词典的填充  29-30
    3.3.2 基于情感词典的微博文本特征选择  30-31
    3.3.3 微博文本集的形式化表示  31-32
  3.4 基于支持向量机的微博文本情感分类算法实现  32-33
  3.5 实验过程、结果及分析  33-37
    3.5.1 数据集的准备  33
    3.5.2 微博文本集的缩放  33-34
    3.5.3 核函数选择  34
    3.5.4 惩罚因子C选择  34
    3.5.5 实验结果及分析  34-37
  3.6 本章小结  37-38
第四章 基于语义规则的微博文本情感分类方法研究  38-54
  4.1 基于语义规则的微博文本情感分类算法基本原理  38-40
    4.1.1 微博文本的情感组成与影响特征  38-39
    4.1.2 HOS模型的提出  39
    4.1.3 基于语义规则的微博文本情感分类流程  39-40
  4.2 语义规则归纳  40-43
    4.2.1 主观性句子辨别与情感词提取规则  40-41
    4.2.2 情感组合特征的选取规则  41-42
    4.2.3 评价对象的选择规则  42
    4.2.4 观点持有者的选择规则  42
    4.2.5 特殊规则的提取  42-43
  4.3 基于语义规则的微博文本情感分类算法描述及实现  43-51
    4.3.1 微博文本语义规则匹配  44-49
    4.3.2 微博文本情感极性值计算  49-51
  4.4 实验结果及分析  51-52
  4.5 两种方法对比与总结  52-53
  4.6 本章小结  53-54
第五章 基于微博文本情感分类的快女淘汰选手预测  54-64
  5.1 新浪微博、快女比赛与数据集介绍  54-56
  5.2 基于微博文本数量统计的淘汰选手预测  56-59
    5.2.1 预测评价指标的提出  56-57
    5.2.2 微博文本数量统计与淘汰对象预测  57-59
    5.2.3 预测结果分析  59
  5.3 基于微博文本情感分类的淘汰选手预测  59-63
    5.3.1 正面文本数量统计与预测  60-62
    5.3.2 预测结果分析  62-63
  5.4 本章小结  63-64
第六章 结束语  64-65
  6.1 论文的创新与总结  64
  6.2 研究工作展望  64-65
致谢  65-67
参考文献  67-72
作者在学期间取得的学术成果  72

相似论文

  1. K公司计划及预测改进对于合理库存配置的研究,F224
  2. 基于图的标志SNP位点选择算法研究,Q78
  3. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  4. 液力减速器制动性能及用于飞机拦阻的仿真研究,TH137.331
  5. 深空撞击探测末制导律的设计与分析,V448.2
  6. 卫星姿态的磁控制方法研究,V448.222
  7. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  8. Hall推进器寿命预测和壁面侵蚀加速实验研究,V439.2
  9. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  10. 高精度激光跟踪装置闭环控制若干关键问题研究,TN249
  11. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  12. 音乐结构自动分析研究,TN912.3
  13. 网络语音传输丢包的恢复技术,TN912.3
  14. 基于三维重建的焊点质量分类方法研究,TP391.41
  15. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  16. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  17. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  18. 基于图像的路面破损识别,TP391.41
  19. 基于神经网络的水厂投药预测控制研究,TP273.1
  20. 基于支持向量机的故障诊断方法研究,TP18
  21. 网络化系统的鲁棒模型预测控制,TP273

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com