学位论文 > 优秀研究生学位论文题录展示

基于语义的文本倾向性分析与研究

作 者: 霍宗凡
导 师: 郑彦
学 校: 南京邮电大学
专 业: 计算机软件与理论
关键词: 文本倾向性 HNC理论 语义 SBV 餐馆评价
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 56次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,随着Internet技术的快速发展,越来越多的网络信息应运而生。然而,人们不再仅仅认为Internet是获取信息的仓库,更成为发表观点、交流看法的园地。对于互联网用户来说,他们可以通过Internet发表对某件热点事件的看法和建议,或了解相关企业的产品质量和服务;对企业来说,他们可以通过建立产品评论专栏,进行市场调查与分析,了解用户对产品的意见和建议,以改进产品性能和售后服务。为了从大量的网络信息中获取有用的信息,对文本倾向性分析研究的重要性得到了国内外学者的高度重视。对文本的倾向性进行分析,其主要目的是判断评论者对评论对象的情感倾向。本课题的主要工作概括如下:(1)分析了传统的文本倾向性分析方法,并指出了其中的不足。通过对语义信息和语义倾向的理论知识分析,讨论了三种基于语义倾向的语义分析方法。(2)在深入研究HNC基本理论的基础上提一出了基于HNC概念基元符号体系理论的语义相关度计算方法,并给出了语义相关度计算公式。最后将基于HNC的语义相关度方法运用到词语的原始极性计算上。(3)提出一种基于I-SBV极性传递文本倾向性算法。首先给出文本倾向性分析的整体流程,分析了当前流行的三种文本倾向性算法,针对网络评论的特点对SBV极性传递算法进行了改进。最后实验证明了改进算法的有效性。(4)对基于I-SBV极性传递算法的餐馆评论系统进行了整体设计,并详细介绍了各主要模块。本文还分别对餐馆的四个特征项(价格、菜品、环境、服务)进行分析,并定义多个指标来衡量评测结果。

全文目录


摘要  4-5
ABSTRACT  5-8
第一章 绪论  8-13
  1.1 选题背景  8-9
  1.2 国内外研究情况  9-11
    1.2.1 词语倾向性分析  9-10
    1.2.2 句子倾向性分析  10-11
    1.2.3 文本倾向分析  11
  1.3 本文创新点  11-12
  1.4 本文的组织结构  12-13
第二章 基于语义文本倾向性分析基础  13-20
  2.1 传统的文本倾向性分析方法  13-14
  2.2 基于语义的文本倾向性  14-16
    2.2.1 语义信息  14
    2.2.2 语义相似度和语义相关度  14-15
    2.2.3 语义倾向定义  15
    2.2.4 基于语义的文本倾向性分析  15-16
  2.3 基于语义倾向的语义分析方法  16-19
    2.3.1 潜在语义索引分析  16
    2.3.2 逐点分析  16-18
    2.3.3 基于HowNet的语义倾向计算  18-19
  2.4 本章小结  19-20
第三章 基于HNC的语义相关度算法与词语极性算法  20-35
  3.1 HNC理论简介  20-26
    3.1.1 网络语言符号  20-21
    3.1.2 概念的一般表达式  21-23
    3.1.3 组合符号  23-25
    3.1.4 五元组  25-26
  3.2 基于HNC的语义相关度计算方案  26-31
    3.2.1 概念基元相关度的计算  26-27
    3.2.2 概念相关度的计算  27-29
    3.2.3 基于HNC语义的相关度算法的实现  29-31
  3.3 基于HNC的语义相关度计算词语的原始极性算法  31-34
    3.3.1 算法框架  31
    3.3.2 算法描述  31-32
    3.3.3 实验测试  32-34
  3.4 本章小结  34-35
第四章 改进的文本倾向性算法  35-52
  4.1 算法整体框架  35
  4.2 文本预处理  35-38
    4.2.1 构建特征词库  35-36
    4.2.2 中文分词  36-38
    4.2.3 去除停用词  38
  4.3 基于上下文的词语的倾向性分析  38-43
    4.3.1 关联词规则  38-40
    4.3.2 基于上下文的段落倾向性分析  40-43
  4.4 文本倾向性算法  43-48
    4.4.1 SBV极性传递算法描述  43-45
    4.4.2 I-SBV极性传递算法  45-46
    4.4.3 基于I-SBV极性传递的文本倾向性算法  46-48
  4.5 实验结果及分析  48-50
    4.5.1 极性测试指标概念定义  48
    4.5.2 极性识别测试  48-49
    4.5.3 测试效率分析  49-50
  4.6 本章小结  50-52
第五章 文本倾向性分析在餐馆评论中的应用  52-61
  5.1 国内外消费评论系统的发展状况  52
  5.2 系统的整体设计  52-57
    5.2.1 系统功能概述  53-54
    5.2.2 系统数据处理流程  54
    5.2.3 特征词库的构建  54-55
    5.2.4 基本概念  55-56
    5.2.5 分项特征识别  56
    5.2.6 绝对分数计算  56-57
    5.2.7 相对分数计算  57
  5.3 系统测试  57-59
  5.4 本章小结  59-61
第六章 总结与展望  61-62
致谢  62-63
参考文献  63-66
攻读硕士学位期间已发表或录用的论文  66

相似论文

  1. 《左传》名词陈述化研究,H146
  2. 基于多示例学习的用户关注概念区域发现,TP391.41
  3. 面向业务过程的服务动态组合方法研究,TP393.09
  4. 基于本体的语义检索研究,TP391.3
  5. 乔治·米勒的认知意义论,B842.1
  6. 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
  7. 心智游移频率特征研究:问卷开发,B841
  8. 汉语框架自动识别中的歧义消解,TP391.1
  9. 现代汉语触觉感官词的认知语义研究,H136
  10. 关系数据库到RDF(S)映射方法的研究,TP311.13
  11. 汉英饮食动词对比研究,H314
  12. 主观题自动评分技术研究,TP391.1
  13. 基于MMTD的模糊语义量化研究,TP18
  14. 情景应对模式下数字化应急预案的语义模型研究,TP391.1
  15. IN/OUT和里、外的对比研究,H030
  16. 彼特纽马克翻译观对《围城》中文化负载词的解释,H315.9
  17. 基于SCOT的语义标签推荐模型及算法研究,TP391.3
  18. 基于大规模模糊RDF数据的推理引擎,TP181
  19. 心灵之眼视野下的心理内容,B849
  20. 基于本体的智能电网知识检索系统,TM76
  21. 图像/视频中自动人脸替换研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com