学位论文 > 优秀研究生学位论文题录展示
基于本体的金融问答系统选股模块的设计与实现
作 者: 凌淑蓓
导 师: 秦兵;陶信东
学 校: 哈尔滨工业大学
专 业: 软件工程
关键词: 自动问答 本体 金融领域 选股 问句解析
分类号: TP311.52
类 型: 硕士论文
年 份: 2011年
下 载: 57次
引 用: 0次
阅 读: 论文下载
内容摘要
随着时代发展和用户对信息检索服务日益增长的需求,自动问答系统受到国内外各科研机构的重视,但是目前尚未出现相对成熟的中文问答系统,尤其是金融领域的问答系统。因此探索以更高效、更人性化的方式为用户提供检索服务具有十分重要的意义。本文的研究对象是金融领域,主要针对选股类型问题的自然语言问答进行了探索研究,并且最终完成系统的开发。本系统包括三个主要组成部分:本体构建、问句分析和检索。本体构建部分使用资源描述语言RDF作为金融知识的存储框架,结合公司数据库中的金融数据,构建了金融领域的顶层本体,实现了股票基本信息到本体知识库的转换。问句解析部分的任务是将自然语言的选股请求转换为半结构化的条件供检索部分使用。该部分使用分词和词性标注,逻辑词识别等预处理工作分析问句,同时结合本体中概念知识对问句进行进一步的语义分析获取问句的真实含义,并且通过对选股问句的分析将句子成分划分为不同的模式,每个模式代表一种语义。检索部分的主要任务是将问句分析的半结构化查询条件转换为结构化查询语言SPARQL并且在本体库中查询,获取符合条件的结果返回给用户。最后,系统使用预先准备的2000句选股问句为测试样本,实验结果表明本体库中的知识可以覆盖97%的问句,95%的问句可以得到正确的分析结果,94.15%的问句可以获得正确的答案。选股问答的平均响应时间在1秒以内,达到预先目标并且已经于公司内部上线。
|
全文目录
摘要 4-5 ABSTRACT 5-9 第1章 绪论 9-14 1.1 课题来源及目的意义 9-10 1.1.1 课题来源 9 1.1.2 课题研究的目的和意义 9-10 1.2 国内外研究现状 10-12 1.2.1 自动问答系统的研究现状 10-11 1.2.2 本体的应用 11-12 1.3 本文的主要研究内容 12-13 1.4 本论文的组织结构 13-14 第2章 需求分析 14-19 2.1 业务需求描述 14-16 2.1.1 金融问答系统业务需求 14-15 2.1.2 选股问答模块业务需求 15-16 2.2 功能和非功能需求 16-18 2.2.1 功能需求 16-17 2.2.2 非功能需求 17-18 2.3 本章小结 18-19 第3章 系统设计 19-44 3.1 选股问答总体设计方案 19-22 3.1.1 系统总体结构 19-21 3.1.2 系统总体设计方案 21-22 3.2 本体构建方案 22-26 3.2.1 本体与本体标记语言 22 3.2.2 资源描述框架RDF 22-23 3.2.3 金融领域本体构建 23-26 3.3 问句分析设计方案 26-34 3.3.1 问句的特点 26 3.3.2 问句解析处理总体流程 26-28 3.3.3 问句预处理模块类结构 28-30 3.3.4 语义解析设计 30-34 3.4 检索模块设计 34-43 3.4.1 SPARQL 及其应用 34-36 3.4.2 SPARQL 生成类结构 36 3.4.3 查询和答案合并 36-43 3.5 本章小结 43-44 第4章 系统实现 44-64 4.1 本体构建模块实现 44-46 4.1.1 基础本体导出 44 4.1.2 构建金融本体 44-46 4.1.3 RDF 的存储 46 4.2 问句解析模块的实现 46-59 4.2.1 分词和词性标注 46-48 4.2.2 预处理 48-54 4.2.3 问句解析 54-59 4.3 检索模块的实现 59-63 4.3.1 查询规则 59 4.3.2 SPARQL 生成 59-61 4.3.3 SPARQL 生成程序流程 61-63 4.4 本章小结 63-64 第5章 系统评测 64-73 5.1 系统评测方案 64-65 5.1.1 功能评测方案 64 5.1.2 性能评测方案 64-65 5.2 测试环境 65 5.3 系统测试结果及评价 65-72 5.3.1 功能测试结果 65-70 5.3.2 性能测试结果 70-71 5.3.3 系统评价 71-72 5.4 本章小结 72-73 结论 73-74 参考文献 74-78 致谢 78-79 个人简历 79
|
相似论文
- 基于词义及语义分析的问答技术研究,TP391.1
- 哲学思想在指导中学数学教学中的作用,G633.6
- 基于本体的语义检索研究,TP391.3
- 不同人群本体感觉差异性比较及脑机制研究,B845
- 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
- 基于分布式描述逻辑的本体模块化构建方法研究,TP391.1
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- 拉图尔的行动者网络理论研究,N02
- 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
- 220kV输电线路除冰机器人机械本体研究,TP242
- 基于本体的食品投诉文档文本聚类研究,TP391.1
- 基于语义的Web服务发现研究,TP393.09
- 本体在智能小区中的应用研究,TP391.1
- 基于领域本体的海洋环境数据仓库设计,TP311.13
- 数据空间中数据资源之间关联关系发现模型研究,TP311.13
- 证券投资组合选股与优化策略应用研究,F830.91
- 情景应对模式下数字化应急预案的语义模型研究,TP391.1
- 基于本体的方剂推荐系统模型研究与应用,TP391.3
- 基于本体的智能电网知识检索系统,TM76
- 基于本体与面向对象的并行程序设计可视化关键技术研究,TP391.41
- 基于自然语言打印机人机交互方法研究与实现,TP11
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com
|