学位论文 > 优秀研究生学位论文题录展示
句子相似度计算理论及应用研究
作 者: 薛慧芳
导 师: 吴江
学 校: 西北大学
专 业: 计算机软件与理论
关键词: 知网 句子相似度计算 FAQ自动问答系统
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 227次
引 用: 2次
阅 读: 论文下载
内容摘要
在自然语言处理领域,汉语句子的相似度计算是一项基础而又重要的工作,它直接决定着相关领域的研究发展状况。比如在FAQ自动问答系统、信息检索、复述、基于实例的机器翻译等领域,句子相似度计算都是一个非常关键的问题,长期以来一直是人们研究的一个热点和难点。为了研究汉语句子相似度计算,本文分别对汉语中的义原、词语、句子三个层次的相似度计算进行了研究。并且针对目前句子相似度计算方法的不足,提出了一种改进的计算方法,最后以FAQ自动问答系统为例,给出句子相似度计算的应用实例。本文完成的主要工作包括:1)义原相似度计算和词语相似度计算研究。由于义原相似度计算是词语相似度计算的基础,而词语相似度计算又是句子相似度计算的基础,所以,本文基于《知网》,对义原相似度计算、词语相似度计算分别做了详细研究。2)提出了改进的句子相似度计算方法。在上述工作的前提下,本文对句子相似度计算进行了研究,并且对其进行了改进,提出了综合多种特征来计算句子相似度的方法。即综合句子的词形相似度、语义相似度、句法结构相似度三方面特征来计算句子相似度。并且,针对词形相似度计算以及语义相似度计算方法也进行了改进,力求最终的句子相似度计算结果更为准确。3)以FAQ自动问答系统为例介绍句子相似度的应用情况。为了说明句子相似度计算的实际应用情况,本文对FAQ自动问答系统、以及句子相似度计算方法在其中的应用进行了介绍。
|
全文目录
相似论文
- WordNet和《中国分类主题词表》的映射研究,G254
- 基于概念集合的网页内容过滤方法的研究,TP393.092
- 基于语义的单文档自动摘要研究,TP391.1
- 基于知网和贝叶斯模型的词义消岐技术的研究,TP391.1
- 汉语语义依存分析研究,TP391.1
- 交互式问答系统中的省略恢复研究,TP391.1
- 基于HowNet的中文语义倾向性分析技术研究,TP391.1
- 基于语义理解的论文相似度研究,TP391.1
- CNKI文献关联推荐用户选择行为的实验研究,G354
- 大规模汉语语义词典构建,TP391.1
- 基于Hownet的汽车领域产品评论挖掘方法研究,TP391.1
- 中文文本分类研究,TP391.1
- 基于语义网的个人数字化站点实现,TP391.1
- 基于语义相似度的本体映射方法研究,TP391.1
- 基于实体—属性框架的标题分析及应用,TP391.1
- 基于边界距离的文本聚类方法研究,TP391.1
- 基于知网的汉语词义消歧方法的研究,TP391.1
- 基于本体的语义检索模型的研究,TP391.3
- 图像视觉特征及其描述词汇的对齐研究,TP391.41
- 中文问答系统中问句理解和相似度计算的研究与实现,TP391.1
- 基于开放域问答系统的问题分类技术研究与实现,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|