学位论文 > 优秀研究生学位论文题录展示
基于语义的文本倾向性分析与应用研究
作 者: 杨天明
导 师: 程显毅
学 校: 江苏大学
专 业: 计算机应用技术
关键词: 语义 文本倾向性 HNC理论 网络舆情
分类号: TP391.1
类 型: 硕士论文
年 份: 2009年
下 载: 384次
引 用: 3次
阅 读: 论文下载
内容摘要
随着互联网技术的迅速发展,如今越来越多的人通过互联网发表他们对商品服务的意见、交流对各种事件的看法,互联网已不仅仅是人们获取信息的仓库,更成为人们发表观点、交流看法的园地,对于互联网用户来说,互联网不仅改变了他们的工作方式,同时也改变了他们的生活方式。通常,人们对某件事物进行评论或者表达自己的观点的时候,常常是具有倾向性的,为了能从这些丰富的信息中提取出有用的信息,文本的倾向性分析研究便应运而生了。对文本的倾向性进行分析,是现在自然语言处理中比较活跃的一个领域,其目的是判断一篇文章对评价对象所持有的倾向是支持还是反对。本文的主要工作概括如下:(1)分析研究了传统的文本倾向性分析方法,并指出了其中的不足。通过对语义信息和语义倾向的理论知识分析,讨论了三种基于语义倾向的语义分析方法。(2)提出一种基于HNC的语义相关度方法计算词语的原始极性算法。在深入研究HNC基本理论的基础上提出了基于HNC概念基元符号体系理论的语义相关度计算方法,根据HNC理论给出了语义相关度计算策略,并实现了概念符号比较的量化计算的详细方法。最后将基于HNC的语义相关度方法运用到词语的原始极性分析上,从而可以较容易也较准确地计算出词语的原始极性。(3)提出一种改进算法计算词语的上下文极性。首先给出文本倾向性算法的整体框架,然后对算法的流程进行了详细的说明。由于忽略句子中的关联词有可能导致极性词的方向或者强度发生错误,所以提出基于上下文的词语的倾向性分析方法来解决这一问题。利用计算极性成分在文本中出现的广度、密度和强度的方法,根据极性词语的分布情况确定评论文本的倾向性。(4)在理论研究的基础上,将文本倾向性分析应用到网络舆情监控系统—国保情报系统中,实验表明,将文本倾向性分析应用到网络舆情监控系统中可提高系统的使用效率。
|
全文目录
摘要 5-6 ABSTRACT 6-9 图表清单 9-11 1 绪论 11-18 1.1 研究意义 11-12 1.2 国内外研究现状 12-15 1.2.1 词语倾向性分析现状 12-14 1.2.2 句子倾向性分析现状 14 1.2.3 文本倾向性分析现状 14-15 1.3 本文的主要工作 15-16 1.4 本文的组织结构 16-18 2 基于语义的倾向性分析理论基础 18-26 2.1 传统的文本倾向性分析方法的研究 18 2.2 基于语义的文本倾向性 18-21 2.2.1 语义信息 18-20 2.2.2 语义相似度和语义相关度 20 2.2.3 语义倾向定义 20-21 2.2.4 基于语义的文本倾向性分析 21 2.3 基于语义倾向的语义分析方法 21-25 2.3.1 潜在语义索引分析 22 2.3.2 逐点分析 22-23 2.3.3 基于HowNet的语义倾向计算 23-25 2.4 本章小结 25-26 3 基于HNC的语义相关度计算词语的原始极性算法 26-37 3.1 HNC理论概述 26-28 3.1.1 HNC理论 26-27 3.1.2 HNC理论基本内容 27-28 3.2 基于HNC的语义相关度计算方法 28-32 3.2.1 HNC语义相关度计算方法 28-31 3.2.2 HNC语义相关度计算方法的优点 31-32 3.3 基于HNC的语义相关度计算词语的原始极性计算算法 32-36 3.3.1 算法描述 32-33 3.3.2 实验测试集 33-34 3.3.3 实验分析 34-36 3.4 本章小结 36-37 4 改进的文本倾向性算法 37-47 4.1 算法整体框架 37 4.2 文本预处理 37-41 4.2.1 中文分词 37-39 4.2.2 去除停用词 39 4.2.3 提取主观性句子 39-41 4.3 基于上下文的词语的倾向性分析 41-43 4.3.1 关联词规则 41-42 4.3.2 词语倾向性分析 42-43 4.4 文本倾向性分析 43-44 4.5 实验词表 44-45 4.6 实验结果及分析 45-46 4.6.1 测试语料 45 4.6.2 词语极性识别测试 45-46 4.7 本章小结 46-47 5 文本倾向性分析应用实例 47-56 5.1 网络舆情理论 47-49 5.1.1 网络舆情的含义与特点 47-48 5.1.2 网络舆情监控系统概述 48-49 5.1.3 网络舆情监控系统框架 49 5.2 舆情关键点分析 49-52 5.2.1 热点话题发现 50 5.2.2 极性话题发现 50-51 5.2.3 焦点话题发现 51-52 5.2.4 敏感话题发现 52 5.3 实验分析 52-53 5.4 文本倾向性分析在国保情报系统中的应用 53-55 5.5 本章小结 55-56 6 总结与展望 56-58 6.1 工作总结 56 6.2 下一步工作展望 56-58 参考文献 58-61 致谢 61-62 论文及科研情况 62
|
相似论文
- 《左传》名词陈述化研究,H146
- 基于多示例学习的用户关注概念区域发现,TP391.41
- 面向业务过程的服务动态组合方法研究,TP393.09
- 中国区域性网上社区的舆情研究,G206
- 基于本体的语义检索研究,TP391.3
- 乔治·米勒的认知意义论,B842.1
- 网络舆情的形成机制研究,G206
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- 心智游移频率特征研究:问卷开发,B841
- 基于语义网络的智能搜索引擎研究,TP391.3
- 汉语框架自动识别中的歧义消解,TP391.1
- 《摩诃僧祗律》范围副词研究,H141
- “二拍”述补结构研究,H141
- 汉语中羡余类形式研究综述,H146
- 范畴化理论在大学英语词汇教学中的应用研究,H319
- 基于贝叶斯理论的社会化标注主题聚类模型研究,C93
- 语用逻辑真值问题研究,H030
- 《水浒传》、《西游记》、《金瓶梅》、《红楼梦》语气词比较研究,H146
- 《论语》心理形容词研究,H131
- 汉语农谚研究,H136
- 汉英插入语对比研究,H314
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|