学位论文 > 优秀研究生学位论文题录展示

产品评论挖掘的观点抽取和分类技术研究

作 者: 李培
导 师: 何中市
学 校: 重庆大学
专 业: 计算机软件与理论
关键词: 产品评论挖掘 特征词抽取 用户观点抽取 极性分类
分类号: TP391.1
类 型: 硕士论文
年 份: 2009年
下 载: 542次
引 用: 9次
阅 读: 论文下载
 

内容摘要


随着Internet和电子商务的发展和普及,Web在很大程度上改变了用户反馈观点的途径。用户购买和使用产品之后会在Web上发表对产品的评论,这些评论中包含用户对产品性能或功能等方面肯定或者否定的态度。生产厂商和用户可以通过分析产品评论获得大量有用信息。但是,Web上评论信息是海量的,属于无结构化数据,生产厂商和用户要想从产品评论中获取信息只有通过人工阅读的方式,而这是一个消耗时间且容易产生错误的过程。因此,产品评论挖掘的研究应运而生,其中用户观点抽取和极性分类是关键的技术,具有十分重要的研究价值。本文针对产品特征词语的抽取和用户观点抽取和极性分类的技术进行了深入研究,主要包括以下几个方面:首先,介绍了产品评论挖掘的研究背景及意义和国内外研究现状,阐述产品评论挖掘中的关键技术。同时,提出了进行评论数据的预处理的一套方案。其次,研究分析了基于统计和基于模式抽取和匹配的产品特征词抽取算法,并将二者结合起来分别用于高频和低频特征词的抽取。抽取包含名词的词语序列作为候选特征词,并制定三个规则进行裁剪获得高频特征词。随后,利用模式抽取和匹配的方法寻找低频特征词。实验结果表明,基于统计和基于模式抽取和匹配的产品特征词抽取算法比基于关联规则挖掘频繁项集和使用支持度裁剪的方法取得了更好的效果。抽取出的特征词语划分为通用特征和专属特征,并构建产品特征库。然后,提出一种基于句子依存关系产生特征和观点关联对的算法。从评论句子中提取出词语的词性和词语间的依存关系,组成依存关系词性对,并通过特定的依存关系词性对来产生特征和观点关联对,以此找出用户观点和产品特征的对应关系。接着,研究提出了特征和观点关联对的极性强度计算方法,根据计算结果进行用户观点的极性分类。使用基于HowNet等资源的中文极性词典判断特征和观点关联对的极性和计算极性强度,并进一步说明对产品型号、产品特征和评论文本进行极性分类的方法。实验结果表明,基于特征和观点关联对和极性词典的极性分类方法对中文产品评论的用户观点极性分类取得了较好的结果。最后,对本文的研究工作进行总结,提出了今后进一步的研究方向。

全文目录


相似论文

  1. 基于情感词的产品评论挖掘研究,TP311.13
  2. 基于语义分析的产品评论挖掘技术研究,TP391.1
  3. 主观性文本的情感极性分析研究,TP391.1
  4. 互联网中文文本分类的研究与应用,TP391.1
  5. 基于特征强化的中文产品评价挖掘研究,TP391.1
  6. 基于跨领域分类学习的产品评论情感分析,TP391.1
  7. 中文产品评论挖掘关键技术研究,TP311.13
  8. 2D人脸模板保护算法研究,TP391.41
  9. 导弹虚拟试验可视化技术研究,TP391.9
  10. 基于智能学习的多传感器目标识别与跟踪系统研究,TP391.41
  11. Q学习在基于内容图像检索技术中的应用,TP391.41
  12. 基于多示例学习的用户关注概念区域发现,TP391.41
  13. 森林防火系统中图像识别算法的研究,TP391.41
  14. 医学超声图像的三维可视化研究,TP391.41
  15. 唇读中的特征提取、选择与融合,TP391.41
  16. 飞行模拟中飞行管理计算机系统CDU组件设计与仿真,TP391.9
  17. 虚拟手术中建模与仿真关键技术研究,TP391.41
  18. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  19. 基于JITT的中职微型课程设计模式与应用,TP391.6
  20. 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
  21. 基于文本挖掘的学者简历自动生成,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com