学位论文 > 优秀研究生学位论文题录展示
基于语义的文本倾向性分析与研究
作 者: 霍宗凡
导 师: 郑彦
学 校: 南京邮电大学
专 业: 计算机软件与理论
关键词: 文本倾向性 HNC理论 语义 SBV 餐馆评价
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 56次
引 用: 0次
阅 读: 论文下载
内容摘要
近年来,随着Internet技术的快速发展,越来越多的网络信息应运而生。然而,人们不再仅仅认为Internet是获取信息的仓库,更成为发表观点、交流看法的园地。对于互联网用户来说,他们可以通过Internet发表对某件热点事件的看法和建议,或了解相关企业的产品质量和服务;对企业来说,他们可以通过建立产品评论专栏,进行市场调查与分析,了解用户对产品的意见和建议,以改进产品性能和售后服务。为了从大量的网络信息中获取有用的信息,对文本倾向性分析研究的重要性得到了国内外学者的高度重视。对文本的倾向性进行分析,其主要目的是判断评论者对评论对象的情感倾向。本课题的主要工作概括如下:(1)分析了传统的文本倾向性分析方法,并指出了其中的不足。通过对语义信息和语义倾向的理论知识分析,讨论了三种基于语义倾向的语义分析方法。(2)在深入研究HNC基本理论的基础上提一出了基于HNC概念基元符号体系理论的语义相关度计算方法,并给出了语义相关度计算公式。最后将基于HNC的语义相关度方法运用到词语的原始极性计算上。(3)提出一种基于I-SBV极性传递文本倾向性算法。首先给出文本倾向性分析的整体流程,分析了当前流行的三种文本倾向性算法,针对网络评论的特点对SBV极性传递算法进行了改进。最后实验证明了改进算法的有效性。(4)对基于I-SBV极性传递算法的餐馆评论系统进行了整体设计,并详细介绍了各主要模块。本文还分别对餐馆的四个特征项(价格、菜品、环境、服务)进行分析,并定义多个指标来衡量评测结果。
|
全文目录
摘要 4-5 ABSTRACT 5-8 第一章 绪论 8-13 1.1 选题背景 8-9 1.2 国内外研究情况 9-11 1.2.1 词语倾向性分析 9-10 1.2.2 句子倾向性分析 10-11 1.2.3 文本倾向分析 11 1.3 本文创新点 11-12 1.4 本文的组织结构 12-13 第二章 基于语义的文本倾向性分析基础 13-20 2.1 传统的文本倾向性分析方法 13-14 2.2 基于语义的文本倾向性 14-16 2.2.1 语义信息 14 2.2.2 语义相似度和语义相关度 14-15 2.2.3 语义倾向定义 15 2.2.4 基于语义的文本倾向性分析 15-16 2.3 基于语义倾向的语义分析方法 16-19 2.3.1 潜在语义索引分析 16 2.3.2 逐点分析 16-18 2.3.3 基于HowNet的语义倾向计算 18-19 2.4 本章小结 19-20 第三章 基于HNC的语义相关度算法与词语极性算法 20-35 3.1 HNC理论简介 20-26 3.1.1 网络语言符号 20-21 3.1.2 概念的一般表达式 21-23 3.1.3 组合符号 23-25 3.1.4 五元组 25-26 3.2 基于HNC的语义相关度计算方案 26-31 3.2.1 概念基元相关度的计算 26-27 3.2.2 概念相关度的计算 27-29 3.2.3 基于HNC语义的相关度算法的实现 29-31 3.3 基于HNC的语义相关度计算词语的原始极性算法 31-34 3.3.1 算法框架 31 3.3.2 算法描述 31-32 3.3.3 实验测试 32-34 3.4 本章小结 34-35 第四章 改进的文本倾向性算法 35-52 4.1 算法整体框架 35 4.2 文本预处理 35-38 4.2.1 构建特征词库 35-36 4.2.2 中文分词 36-38 4.2.3 去除停用词 38 4.3 基于上下文的词语的倾向性分析 38-43 4.3.1 关联词规则 38-40 4.3.2 基于上下文的段落倾向性分析 40-43 4.4 文本倾向性算法 43-48 4.4.1 SBV极性传递算法描述 43-45 4.4.2 I-SBV极性传递算法 45-46 4.4.3 基于I-SBV极性传递的文本倾向性算法 46-48 4.5 实验结果及分析 48-50 4.5.1 极性测试指标概念定义 48 4.5.2 极性识别测试 48-49 4.5.3 测试效率分析 49-50 4.6 本章小结 50-52 第五章 文本倾向性分析在餐馆评论中的应用 52-61 5.1 国内外消费评论系统的发展状况 52 5.2 系统的整体设计 52-57 5.2.1 系统功能概述 53-54 5.2.2 系统数据处理流程 54 5.2.3 特征词库的构建 54-55 5.2.4 基本概念 55-56 5.2.5 分项特征识别 56 5.2.6 绝对分数计算 56-57 5.2.7 相对分数计算 57 5.3 系统测试 57-59 5.4 本章小结 59-61 第六章 总结与展望 61-62 致谢 62-63 参考文献 63-66 攻读硕士学位期间已发表或录用的论文 66
|
相似论文
- 《左传》名词陈述化研究,H146
- 基于多示例学习的用户关注概念区域发现,TP391.41
- 面向业务过程的服务动态组合方法研究,TP393.09
- 基于本体的语义检索研究,TP391.3
- 乔治·米勒的认知意义论,B842.1
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- 心智游移频率特征研究:问卷开发,B841
- 汉语框架自动识别中的歧义消解,TP391.1
- 现代汉语触觉感官词的认知语义研究,H136
- 关系数据库到RDF(S)映射方法的研究,TP311.13
- 汉英饮食动词对比研究,H314
- 主观题自动评分技术研究,TP391.1
- 基于MMTD的模糊语义量化研究,TP18
- 情景应对模式下数字化应急预案的语义模型研究,TP391.1
- IN/OUT和里、外的对比研究,H030
- 彼特纽马克翻译观对《围城》中文化负载词的解释,H315.9
- 基于SCOT的语义标签推荐模型及算法研究,TP391.3
- 基于大规模模糊RDF数据的推理引擎,TP181
- 心灵之眼视野下的心理内容,B849
- 基于本体的智能电网知识检索系统,TM76
- 图像/视频中自动人脸替换研究,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|