学位论文 > 优秀研究生学位论文题录展示
基于语义信息检索关键技术的研究与实现
作 者: 王小旭
导 师: 曹伯燕; 司栋森
学 校: 西安电子科技大学
专 业: 计算机系统结构
关键词: 句子相似度 信息检索 中文语义 意图分析 语法向量
分类号: TP391.3
类 型: 硕士论文
年 份: 2011年
下 载: 17次
引 用: 0次
阅 读: 论文下载
内容摘要
随着网络技术的迅猛发展,信息呈现出爆炸式增长。信息检索系统已经成为网络世界中获取信息不可或缺的手段。然而传统基于关键词的信息检索技术并不能准确地理解用户真实需求,通常会带来大量的垃圾信息。所以,如何从语义上理解和提取用户的查询意图,将最准确的信息检索出来,成为信息检索领域重要的研究方向。本文对于基于语义词典的中文句子相似度计算及其在信息检索中的应用进行了深入的研究,在《同义词词林》基础上建立了一种新的基于语法向量的中文语义相似度计算算法。该算法以汉语语法结构为切入点,综合句义和句法两方面特征计算句子相似度,充分考虑到词语间关系及语义贡献度对相似度的影响,并针对不同的语法成分设计不同的权重参数,有效的提高了相似度计算的准确性。然后给出本文算法在语义检索领域的应用,提出了基于意图分析的句子级语义检索模型。最后在封闭性环境下对算法进行了测试,并将本文算法与其他语义算法进行比较。实验表明在语法信息正确的前提下,本文所提出的算法可显著提高检索性能,达到较好的效果。
|
全文目录
摘要 3-4 Abstract 4-7 第一章 绪论 7-11 1.1 基于语义信息检索的背景 7 1.2 语义信息检索技术的研究现状 7-9 1.3 本论文的组织结构 9-11 第二章 基于语义的信息检索研究综述 11-19 2.1 传统的信息检索模型 11-13 2.1.1 布尔模型 11 2.1.2 向量空间模型 11-12 2.1.3 概率模型 12-13 2.2 基于语义信息检索技术 13-18 2.2.1 语句相似度定义 13 2.2.2 基于语义的语句相似度算法 13-17 2.2.3 基于语义的语句相似度算法分析 17-18 2.3 本章小结 18-19 第三章 基于语法向量的语句相似度算法设计与实现 19-37 3.1 基于语义的词语相似度计算 19-23 3.1.1 同义词林 19-20 3.1.2 词语相似度算法 20-23 3.2 语句语法向量模型 23-30 3.2.1 基于语法的句子向量模型表示 23-25 3.2.2 基于语法的句子向量模型建立 25-30 3.3 基于语法向量的句子语义相似度计算 30-36 3.3.1 句子相似度的构成 30-31 3.3.2 语义相似度计算 31-36 3.4 本章小结 36-37 第四章 基于意图分析的句子级语义检索模型设计与实现 37-51 4.1 基于意图分析的句子级语义检索概述 37-38 4.2 用户意图 38-42 4.2.1 用户意图分析 38-39 4.2.2 用户意图提取规则 39-42 4.3 基于意图分析的信息检索实现 42-50 4.3.1 答案模型 43-45 4.3.2 权重分配 45-46 4.3.3 基于意图分析的检索系统 46-50 4.4 本章小结 50-51 第五章 系统测试与分析 51-65 5.1 信息检索技术性能评价方法 51 5.2 实验一 句子相似度测试 51-57 5.3 实验二 问句检索测试 57-61 5.4 实验三 互联网搜索对比测试 61-63 5.5 本章小结 63-65 第六章 总结与展望 65-67 6.1 总结 65 6.2 展望 65-67 致谢 67-69 参考文献 69-72
|
相似论文
- 生物医学领域检索系统查询扩展技术研究,TP391.3
- 基于Web的未登录词翻译技术研究,TP391.2
- 外文数据库无障碍信息检索的策略研究,G354
- 基于Struts2框架的安全教育管理信息系统研究,TP311.52
- 智能答疑系统中句子相似度计算的研究与应用,TP391.1
- 面向销售服务的自动问答系统的设计与实现,TP311.52
- 数据库中基于多索引段的全文索引研究,TP311.13
- 基于分布式的垂直搜索引擎的研究与实现,TP391.3
- 面向行业搜索引擎的研究与实现,TP391.3
- 基于策略Agent的个性化信息检索系统的研究与实现,TP391.3
- 隐私保护信息检索协议及其应用研究,TP393.08
- 基于稀疏非负矩阵分解的图像检索,TP391.41
- 排序学习损失函数的研究,TP181
- 基于个性化推荐的图像浏览与检索相关方法研究,TP391.41
- Web多文档自动文摘研究,TP391.1
- 基于对等网络的搜索引擎关键技术研究,TP391.3
- 基于本体的语义查询扩展研究,TP391.3
- 搜索引擎中网络爬虫技术研究,TP391.3
- 基于R树的空间—文本混合索引方法,P208
- 基于Web检索的查询意图分类研究,TP391.3
- 基于语义网络的自动文摘研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|