学位论文 > 优秀研究生学位论文题录展示
文本情感分析在产品评论中的应用研究
作 者: 魏慧玲
导 师: 姚家奕
学 校: 北京交通大学
专 业: 信息管理
关键词: 情感分析 产品评论 文本挖掘 词性模板 依存关系 情感词 特征词
分类号: TP391.1
类 型: 硕士论文
年 份: 2014年
下 载: 95次
引 用: 0次
阅 读: 论文下载
内容摘要
摘要:随着计算机技术的蓬勃发展,互联网(如博客、论坛和电商网站)上产生了大量用户参与的、对于某种产品有价值的评论信息。这些评论信息直接表达了用户对产品功能或性能方面所持的肯定或否定态度。对这些产品评论信息进行挖掘对于商家和潜在的消费者意义重大。本文针对小米公司通过人工阅读论坛上的评论来获取用户需求的低效性,提出应用文本情感分析技术来挖掘产品评论信息,研究对象是小米手机的产品评论。首先,简要介绍小米科技公司及其用户参与的研发模式,然后对其用户参与的研发模式的现状进行分析,发现通过人工阅读评论来获得用户需求信息的低效性,从而提出一套高效自动化的产品评论应用方案,详细地给出产品评论应用方案的流程图,主要包括产品特征词和情感词对的抽取和情感分类两部分。然后构建小米手机产品评论语料库,对评论数据进行预处理、分词、词性标注和句法分析之后,分别基于词性模板和句法关系抽取产品特征词和情感词对,并通过实验验证了这两种方法的有效性。接着,构建情感词典,基于情感词词典对产品特征进行情感分类,并把情感分类的结果以图表的方式展示出来。最后,设计并实现了一个产品评论挖掘系统。该系统可以抓取指定页面的评论数据,可以基于词性模板和句法关系抽取产品特征词和情感词对,可以基于情感词典对产品特征进行情感分类,并提供可视化的结果展示。
|
全文目录
致谢 5-6 中文摘要 6-7 ABSTRACT 7-8 目录 8-11 1 绪论 11-20 1.1 选题背景与意义 11-12 1.2 国内外研究现状分析 12-17 1.2.1 文本情感分析的研究现状 12-14 1.2.2 产品评论挖掘的研究现状 14-16 1.2.3 产品评论挖掘系统构建研究现状 16-17 1.3 本文研究内容 17-19 1.4 本章小结 19-20 2 相关理论与技术综述 20-29 2.1 文本情感分析的过程 20-21 2.2 用户评论含义以及表现形式 21-22 2.2.1 用户评论含义 21 2.2.2 用户评价的表现形式 21-22 2.3 中文语句的分词和词性标注介绍 22-24 2.4 依存句法关系介绍 24-27 2.5 知网(HowNet)情感词典介绍 27-28 2.6 本章小结 28-29 3 小米手机产品评论的应用现状分析及应用方案设计 29-38 3.1 小米科技有限责任公司简介 29 3.2 用户参与的研发模式介绍 29-31 3.3 现存的问题分析 31-32 3.4 产品评论应用方案设计 32-37 3.4.1 应用方案一级流程图 34-35 3.4.2 应用方案细化流程图 35-37 3.5 本章小结 37-38 4 产品特征词和情感词对抽取 38-50 4.1 小米手机产品评论语料库的构建 38-41 4.1.1 产品评论数据的抓取 39-40 4.1.2 产品评论数据的预处理 40-41 4.2 基于词性模板抽取产品特征词和情感词对 41-43 4.2.1 词性模板抽取思想 42 4.2.2 词性搭配模式抽取算法 42-43 4.2.3 词性模板抽取结果 43 4.3 基于依存句法关系抽取产品特征词和情感词对 43-47 4.4 特征词和情感词对抽取实验 47-49 4.4.1 评价指标 47-48 4.4.2 实验结果及分析 48-49 4.5 本章小结 49-50 5 基于情感词典的产品特征的情感倾向分析 50-64 5.1 产品特征词库的构建 51-53 5.1.1 产品特征词库构建原则 51 5.1.2 产品特征词来源以及特点 51-53 5.2 情感词库的构建 53-57 5.2.1 情感词的定义 54 5.2.2 情感词库的构建 54-57 5.3 评价短语的识别 57-59 5.4 评价短语的情感倾向性权值计算方法 59 5.5 产品特征的情感分析 59-61 5.6 挖掘结果展示 61-63 5.7 本章小结 63-64 6 产品评论挖掘系统的设计与实现 64-72 6.1 系统基本需求分析 64 6.2 系统设计 64-67 6.2.1 系统总体功能结构框架图 64-65 6.2.2 系统业务流程设计 65-66 6.2.3 数据库设计 66-67 6.3 系统实现 67-71 6.3.1 系统开发平台 68-69 6.3.2 词库构建模块 69 6.3.3 信息抽取模块 69-70 6.3.4 情感分类模块 70 6.3.5 情感摘要模块 70-71 6.4 本章小结 71-72 7 论文总结 72-74 7.1 论文总结 72 7.2 进一步工作 72-74 参考文献 74-77 附录A 77-82 作者简历 82-84 学位论文数据集 84
|
相似论文
- 四川方言特征词研究,H17
- 评价对象抽取研究,TP391.1
- 高、低剂量率γ线照射对哺乳类细胞生长存活及DNA损伤修复的影响,R818
- 基于主题分类特征的物业评论情感分析,TP391.1
- 基于博客搜索的博文情感倾向性分析技术的研究,TP391.1
- 中文产品评论观点抽取方法研究,TP391.1
- 基于Web搜索和网页结构分析的IT相关主题新闻抓取研究,TP393.092
- 基于时空关键点的动作识别算法研究,TP391.41
- 基于情感词的产品评论挖掘研究,TP311.13
- 互联网评论中伪信息与有价值信息的自动识别,TP393.09
- 短文本情感分析技术研究,TP391.1
- 数据挖掘技术在世博客流与社交媒体预测中的研究与应用,TP311.13
- 基于关联规则和图排序的句子情感倾向性研究,TP391.1
- 多分类器系统在日语依存关系解析中的研究,TP391.1
- 基于英文博客空间文本的情感分析研究,TP391.1
- 基于语义分析的产品评论挖掘技术研究,TP391.1
- 基于HowNet的中文语义倾向性分析技术研究,TP391.1
- 主观性文本的情感极性分析研究,TP391.1
- 济宁方言词汇研究,H17
- 互联网公关传播效果评估研究,G206
- Web文本聚类与分类算法研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|