学位论文 > 优秀研究生学位论文题录展示

基因本体及其注释数据语义网模型

作 者: 许庆炜
导 师: 骆清铭;李亦学
学 校: 华中科技大学
专 业: 生物医学工程
关键词: 语义网 基因本体 GLUE系统 Oracle NDM 本体映射
分类号: Q75
类 型: 博士论文
年 份: 2008年
下 载: 420次
引 用: 1次
阅 读: 论文下载
 

内容摘要


作为当前应用最广泛的生物本体,截至2007年8月,基因本体中共包含了大约23,700条术语,对约20个生物数据库中超过1600万条的基因和基因产物进行注释。在语义网应用领域,基因本体协会提供了一个RDF-XML格式文件?(http://archive. geneontology.org/latest-full/go200708-assocdb.rdf-xml.gz)。然而该文件存在以下缺点,无法提供复杂的语义查询和推理服务:1)基因本体的三个子本体间是相互孤立的,缺乏必要的跨本体语义联系。2)文件以基因本体术语为中心进行组织,所有的信息都存放在一个单独的文件中。3)文件中缺乏对GOSlim的支持。本文中我们提出了一个语义网模型GORouter。该模型主要论证了如何利用多种基于RDF规范的语义网技术和工具对原始资源重新组织,为用户提供复杂的有关基因本体及其注释数据的语义查询和推理服务。我们对基因本体协会提供的异构原始数据重新进行编码,构建了一系列的RDF数据模块。GORouter模型中每个RDF模块由两个部分组成:元数据部分采用RSS技术进行标识、数据部分采用LSID技术进行全球统一命名。通过采用GLUE系统,我们在三个独立的基因子本体间建立了一对一类型的本体映射关系。为了提高映射精确度,GLUE系统采用“放宽标记”技术获得在给定领域约束和先验知识的条件下最佳的映射配置方案。我们采用Oracle NDM作为RDF存储容器,通过调用SDORDFMATCH表函数无缝的将RDF查询结果与传统的关系型数据结合起来。最终,GORouter模型的规模被最小化,那些不直接和语义推理相关的数据将被存储在传统的关系数据表中。我们相信该解决方案能够部分克服传统语义网应用程序的性能瓶颈问题。GORouter模型及其应用程序支持Apache 2.0开放协议,研究人员可以通过访问http://www.scbit.org/gorouter/来获得最新数据和服务。

全文目录


相似论文

  1. WordNet和《中国分类主题词表》的映射研究,G254
  2. 基于大规模模糊RDF数据的推理引擎,TP181
  3. 语义网自动构建中句法分析的研究,TP391.1
  4. 基于关系数据库的本体半自动构建方法,TP311.13
  5. 蛋白质关系网络复合物发现与可视化研究,TP391.41
  6. 人类miRNA调控因子及靶基因的基因本体分析,R346
  7. 描述逻辑归结推理的研究,TP18
  8. 基于BP神经网络的本体映射方法研究,TP311.52
  9. 基于元数据的领域异构数据交换技术研究,TP311.13
  10. 基于OWL-S的Web服务发现框架研究,TP393.09
  11. 温光敏雄性不育小麦穗部发育时期均一化cDNA文库的构建、鉴定和EST分析以及减数分裂时期细胞骨架荧光标记体系探索,S512.1
  12. 基于多特征融合的乳腺癌相关基因预测方法研究,R737.9
  13. 知识管理系统的关键技术研究,TP182
  14. 一种基于基因本体的无监督聚类方法,TP391.1
  15. 基于多源信息融合的基因表达数据聚类分析,TP399-C8
  16. 基于MDA的本体建模方法研究,TP182
  17. 语义网中基于描述逻辑的本体推理研究,TP18
  18. 基于知识单元的语义Wiki知识库,TP182
  19. 基于本体的智能搜索技术实现,TP391.3
  20. 基于本体的软件需求跟踪的研究,TP311.52
  21. 不精确本体模型与构建研究,TP391.1

中图分类: > 生物科学 > 分子生物学 > 分子遗传学
© 2012 www.xueweilunwen.com