学位论文 > 优秀研究生学位论文题录展示
基于语义相似性和等级结构数据计算基因间表型相似性
作 者: 张善镇
导 师: 许艳
学 校: 哈尔滨医科大学
专 业: 生物物理学
关键词: 语义相似性 等级结构 人类基因表型 基因相似性
分类号: TP391.1
类 型: 硕士论文
年 份: 2012年
下 载: 5次
引 用: 0次
阅 读: 论文下载
内容摘要
基因表型相似性和基因功能的多个方面密切相关,例如基因表型相似性和蛋白质互作是相关联的。基因发生缺失或变异对其表型的影响亦是基因注释的一部分,目前,对该领域的研究日益受到广泛的关注。然而,基于人类表型本体论(Human Phenotype Ontology,HPO)数据研究基因表型相似性的方法并不多见。因此,研究和开发行之有效的算法很有必要。本课题利用来自人类表型本体论数据库中等级结构数据和基于语义相似性的五种测度(Jiang and Conrath’s,Lin’s,Schlicker’s,Yu’s和Wu’s)计算人类基因间表型相似性。此外,本文还提出新的结合余弦和基因注释水平计算基因间表型相似性的方法。并分别利用蛋白质-蛋白质互作、蛋白质复合物、蛋白质家族、基因功能和DNA序列等信息来评估这些算法的正确率和性能。对每种方法都做了1000次随机,并与实际计算结果进行了比较。结果表明,这些方法计算得到的结果与随机比有显著差异(P<0.001)。此外,本文还用receiver operating characteristic (ROC)曲线分析方法对这六种方法的性能进行了评价。研究表明,六种方法的性能大部分优于先前的文本挖掘方法。本课题证实了基于语义相似性测度和等级结构数据及结合余弦与基因注释水平都能有效的计算基因间表型相似性。本课题的结论为研究、开发和优化计算基因表型相似性算法提供了更多更有意义的帮助,并为从事该领域的研究人员提供了更多可选择的计算工具。
|
全文目录
中文摘要 6-7 Abstract 7-9 第1章 引言 9-13 1.1 基因表型相似性的研究进展 9-11 1.2 课题的提出和研究目的 11-13 第2章 材料和方法 13-24 2.1 材料 13-16 2.1.1 人类表型本体论数据 13 2.1.2 OMIM 数据 13 2.1.3 MeSH 词汇表 13-14 2.1.4 金标准阳性集数据 14-16 2.2 方法 16-24 2.2.1 HPO 条目的平均负信息量和概率 16 2.2.2 表型相似性测度 16-19 2.2.3 基因间表型相似性 19-20 2.2.4 性能评估 20-24 第3章 结果 24-33 3.1 基因对的表型相似性 24-25 3.2 随机分析 25 3.3 表型-蛋白质互作的相关分析 25-27 3.4 表型-蛋白质复合物的相关分析 27-29 3.5 性能评估 29-33 第4章 讨论 33-36 结论 36-37 参考文献 37-43 附录 43-45 攻读硕士学位期间参加课题工作 45-46 个人简历 46
|
相似论文
- 基于PLSA语义聚类的web服务发现方法,TP393.09
- 与先天性心脏传导阻滞(CHB)相关小分子药物靶点的研究,R714.5
- 身份密码的密钥管理研究,TN918.2
- 城市新区道路网系统规划理论方法研究,U412.1
- 新农村建设背景下的山东省农村公路网规划和评价研究,U412.1
- 个人基因组信息管理及可视化技术研究,TP311.13
- 万州区农村公路路面结构研究,U416.2
- 基于文本信息与视觉信息相结合的Web图像检索,TP391.41
- 面向web图片检索的文本和图片信息融合技术研究,TP391.41
- 基于分形理论的旅游资源评价研究,F592.7
- 舟山群岛的植被覆盖度与景观格局的变化研究,Q948
- Web服务语义相似性度量方法研究,TP393.09
- 搜索引擎中网络爬虫及结果聚类的研究与实现,TP391.3
- 基于运输需求的区域公路网规划研究,O221
- 复杂网络演化模型及拓扑优化研究,N941.4
- 上海市崇明县植被覆盖度的遥感估算及其动态研究,Q948
- 当代大学生孝道观的本地研究,H315.9
- ORM中间层基于缓存的性能与可靠性保证技术研究,TP311.52
- 基于供需平衡的中小城市道路网规模研究,U491.13
- 城市道路网合理结构研究,U491.13
- miRNA靶基因计算分析新方法及其应用研究,Q75
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|