学位论文 > 优秀研究生学位论文题录展示
基于Web的比较观点挖掘方法研究
作 者: 李红霞
导 师: 王素格
学 校: 山西大学
专 业: 模式识别与智能系统
关键词: 观点挖掘 语义角色标注 汉语比较句 汉语框架语义网络
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 25次
引 用: 0次
阅 读: 论文下载
内容摘要
随着互联网“草根主义”的蓬勃兴起,互联网用户逐渐由被动地接收互联网信息向主动地创造互联网信息发展,互联网上产生了大量的由用户发表的有价值的评论信息。如何从这些海量数据中便捷有效地挖掘出潜在用户感兴趣的评论要点,已成为目前亟待解决的问题之一。因此,观点挖掘技术应运而生,并迅速成为信息处理领域的一个研究热点。为了能够比较精细地刻画观点挖掘的结果,本文针对句子层面上的观点挖掘问题进行了研究,主要内容如下:(1)对第二届中文倾向性分析评测(COAE2009)中与观点相关的评测任务以及我们参与评测时使用的方法进行了概述,并对评测结果做了总体的分析,在分析的基础上概括出了观点的核心要素,定义了句子层面观点挖掘的主要目的与任务。(2)研究了汉语比较句的语义角色标注问题。利用汉语比较句的句法结构建立了原始的混合比较模板,并进一步对原始模板进行了泛化以提高其召回率;然后提出了一个二级标注算法分别标注比较实体和比较属性,最终实现了比较句的语义角色自动标注。实验表明,该方法是可行的。(3)对汉语比较句进行了观点挖掘研究。提出了比较观点的描述形式,该描述形式通过对不同类型的比较结果进行了标准化处理,为它们的进一步归纳与整合提供了依据,其次,对比较句的句式构造了比较模式,按其所提供的情感信息进行了分类。最后在语义角色标注的基础上,提出了基于比较模式的比较观点挖掘算法,并在真实语料上对算法的性能进行了验证。(4)建立了基于Web的汽车评论比较观点挖掘系统。该系统集汉语比较句的识别、语义角色标注与比较观点挖掘于一体。通过网络爬虫技术定时更新后台知识库,对评论文本进行断句、分词及词性标注等预处理之后,标注识别出的汉语比较句并进行比较观点挖掘,系统最终根据用户的选择,给出与某个汽车品牌或者汽车的某个属性相关的所有对比结果。
|
全文目录
摘要 9-10 ABSTRACT 10-12 第一章 绪论 12-17 1.1 观点挖掘的意义 12 1.2 国内外研究现状 12-15 1.3 课题的研究难度 15 1.4 本文的研究工作 15-16 1.5 论文的组织结构 16-17 第二章 观点句及观点要素识别研究综述 17-26 2.1 COAE2009相关任务分析 17-23 2.1.1 COAE2009相关任务介绍 17 2.1.2 观点句抽取方法介绍 17-18 2.1.3 观点要素抽取方法介绍 18-20 2.1.4 评测结果分析 20-23 2.2 观点句的定义及其要素总结 23-25 2.2.1 观点句的定义及核心要素 23-24 2.2.2 观点的其它要素总结 24-25 2.3 本章小结 25-26 第三章 基于混合模板的中文比较句语义角色自动标注研究 26-36 3.1 比较句 26-28 3.1.1 汉语比较句 26-27 3.1.2 比较句的类型 27-28 3.2 语义角色标注 28-29 3.2.1 语义角色标注介绍 28 3.2.2 比较句语义角色标记 28-29 3.3 混合模板 29-31 3.3.1 初始混合比较模板 29-30 3.3.2 模板的泛化 30-31 3.4 基于混合模板的汉语比较句语义角色标注算法 31-32 3.4.1 一级标注算法 31-32 3.4.2 二级标注算法 32 3.5 实验结果与分析 32-35 3.5.1 实验数据集及评测指标说明 32-33 3.5.2 实验结果与分析 33-35 3.6 本章小结 35-36 第四章 基于语义角色标注的中文比较句的观点挖掘研究 36-44 4.1 比较观点描述 36-38 4.2 比较模式的情感倾向 38-39 4.2.1 级比句 38-39 4.2.2 比较句中比较模式的情感倾向 39 4.2.3 比较句式与比较模式的对应关系 39 4.3 比较句的比较观点挖掘算法 39-41 4.4 实验结果与分析 41-43 4.5 本章小结 43-44 第五章 基于汽车领域的比较观点挖掘系统 44-50 5.1 系统结构 44 5.2 后台知识库的构建 44-46 5.2.1 数据预处理 44-46 5.2.2 比较句的识别与语义角色标注 46 5.3 人机交互可视化 46 5.4 本章小结 46-50 第六章 结论与展望 50-52 6.1 结论 50-51 6.2 展望 51-52 参考文献 52-57 研究成果 57-58 致谢 58-59 个人简介 59-61
|
相似论文
- 基于博客搜索的博文情感倾向性分析技术的研究,TP391.1
- 基于马尔可夫逻辑网络的语义角色标注,TP391.1
- 面向金融问答的论坛观点挖掘,TP391.3
- 基于情感字典与机器学习相结合的文本情感分类,TP391.1
- 语义角色标注的集成策略的研究,TP391.1
- 基于依存关系的中文语义角色标注研究,TP391.1
- 基于语义搭配的评论倾向性分析,TP391.1
- 基于依存句法分析的语义角色标注,TP391.1
- 基于条件随机场模型的汉语框架语义角色自动标注研究,TP391.1
- 面向三维场景生成的中文语义角色标注方法研究,TP391.1
- 基于汉语框架网的问句语义角色标注研究,TP391.1
- 基于支持向量机的汉语框架语义角色自动标注,TP391.1
- 基于最大熵模型的汉语框架语义角色自动标注,TP391.1
- 基于条件场的语义角色标注,TP391.1
- 中文复杂句语义角色标注,TP391.1
- 语义角色标注中的关键技术研究,TP391.1
- 互联网舆情发现与观点挖掘技术研究,TP393.09
- 基于结构学习的语义角色标注,TP391.1
- 网络舆情信息挖掘关键技术研究与应用,TP393.09
- 基于特征强化的中文产品评价挖掘研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|