学位论文 > 优秀研究生学位论文题录展示
基于蛋白质相互作用网络的聚类和稀疏点检测算法研究
作 者: 彭利红
导 师: 廖波
学 校: 湖南大学
专 业: 计算机系统结构
关键词: PPI网络 K-means聚类方法 相似度 AAMV法 稀疏点检测
分类号: TP301.6
类 型: 硕士论文
年 份: 2008年
下 载: 212次
引 用: 3次
阅 读: 论文下载
内容摘要
随着人类基因组测序的完成,对蛋白质结构和功能的研究成为基因组学研究的一大热点。研究证明,蛋白质在其功能组中很少以单个个体而存在,一般与功能相似的蛋白质之间存在相互作用。因此,我们可以通过对蛋白质相互作用(Protein-Protein interaction,PPI)网络的研究来预测其功能。本文将在基于PPI网络的聚类及稀疏点检测算法两方面进行研究:提出一种蛋白质功能预测算法——基于算术平均最小值(the Arithmetic Ave- rage Minimum Value, AAMV)的K-means聚类算法。首先,根据蛋白质之间的相互作用,通过人类AD(Alzheimer’s Disease)相关PPI网络图,得出蛋白质之间的关联矩阵;然后,利用AAMV法求得相似度矩阵;接着,鉴于误差平方和准则不能较好的对聚类进行收敛,提出了加权的误差平方和准则;最后,在相似度矩阵的基础上,利用加权的误差平方和准则进行有效收敛,利用K-means聚类方法对PPI网络中的蛋白质进行聚类与功能预测。提出PPI网络中的稀疏点检测算法——基于加权的相似系数和算法。首先,根据蛋白质之间的相互作用,通过人类AD(Alzheimer’s Disease)相关PPI网络图,得出蛋白质之间的关联矩阵;然后,利用最大最小值法求得相似系数矩阵;接着,由于相似系数和不能对PPI网络中的稀疏点进行更好的检测,因此,在相似系数的基础上提出加权的相似系数和方法。最后,根据输入的阈值,利用相似系数和算法得出PPI网络中的稀疏蛋白质。基于人类AD相关PPI网络图,利用基于AAMV的K-means算法对图中蛋白质进行聚类,其结果与Maryland Bridge法和Korbel法所得结果非常相似;利用聚类结果,对四个孤立蛋白质的功能进行预测。同时,利用加权的相似系数和算法对图中的稀疏蛋白质进行检测,实验结果表明:输入的阈值取值在0.01-0.16之间时,其精确度比较高。
|
全文目录
摘要 5-6 Abstract 6-12 第1章 绪论 12-21 1.1 本文的研究目的 12 1.2 项目来源 12 1.3 选题背景和意义 12-17 1.3.1 生物信息学概念 12-13 1.3.2 生物信息学的主要研究内容 13-15 1.3.3 生物信息学的研究目标和任务 15-16 1.3.4 生物信息学的研究意义 16-17 1.4 蛋白质组学研究 17-18 1.5 本文的主要工作及结构安排 18-21 1.5.1 本文的主要研究内容 18 1.5.2 本文的组织结构 18-21 第2章 生物数据挖掘及PPI 网络概述 21-34 2.1 生物数据挖掘 21-22 2.2 聚类分析算法 22-25 2.2.1 基于划分的方法 22-24 2.2.2 基于层次的方法 24-25 2.2.3 基于密度的方法 25 2.2.4 基于网格的方法 25 2.2.5 基于模型的方法 25 2.3 PPI 及其网络 25-29 2.3.1 大规模PPI 研究的目的及意义 25-26 2.3.2 大规模PPI 的研究策略及方法 26 2.3.3 大规模PPI 的研究现状 26-27 2.3.4 PPI 网络 27-29 2.4 孤立点挖掘方法 29-32 2.4.1 基于统计的方法 29-30 2.4.2 基于距离的方法 30-31 2.4.3 基于偏离的方法 31 2.4.4 基于密度的方法 31-32 2.5 孤立点检测方法研究现状概述 32-33 2.6 小结 33-34 第3章 基于PPI 网络的聚类算法 34-48 3.1 引言 34-35 3.2 相似性度量——AAMV 法 35-39 3.3 聚类准则函数 39 3.4 基于AAMV 的K-MEANS 聚类算法 39-42 3.4.1 算法的处理流程 39-40 3.4.2 算法描述 40-42 3.5 实验及比较分析 42-46 3.5.1 利用基于AAMV 的K-means 聚类算法进行聚类的结果 42-44 3.5.2 利用Maryland Bridge 方法进行聚类的结果 44 3.5.3 利用Korbel 方法进行聚类的结果 44-45 3.5.4 实验结果的分析比较 45-46 3.6 小结 46-48 第4章 基于PPI 网络的稀疏点检测 48-59 4.1 引言 48-49 4.2 相似度定义 49-51 4.3 相似系数和 51-52 4.3.1 相似系数和 51-52 4.3.2 加权的相似系数和 52 4.4 基于PPI 网络的稀疏点检测算法 52-55 4.4.1 算法的处理流程 52-53 4.4.2 算法描述 53-55 4.5 实验及其分析 55-58 4.5.1 实验结果 55-56 4.5.2 实验结果的分析 56-58 4.5.3 算法时间复杂度分析 58 4.6 小结 58-59 结论 59-61 参考文献 61-65 致谢 65-66 附录A 攻读硕士期间发表的论文和参加的项目 66
|
相似论文
- 基于句法特征的代词消解方法研究,TP391.1
- 多邮件自动文摘的关键技术研究,TP391.1
- 基于相似度计算的编程题自动评判方法研究,TP312.1
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- WordNet和《中国分类主题词表》的映射研究,G254
- 基于本体的食品投诉文档文本聚类研究,TP391.1
- Web环境下基于语义模式匹配的实体关系提取方法的研究,TP391.1
- 智能答疑系统中句子相似度计算的研究与应用,TP391.1
- 应用于搜索引擎的人物分类系统设计与实现,TP391.3
- 基于CBR的离散模拟模型可复用性研究,TP301.6
- 面向论坛信息文本的有效数据抽取研究,TP391.1
- 基于链接重要性的动态链接预测算法研究,TP393.03
- 社会化网络中的推荐算法及其应用,TP391.3
- 网络环境下人才知识结构智能交互生成方法研究,TP391.6
- 基于本体的智能电网知识检索系统,TM76
- 基于内容的大规模数字图像检索技术研究,TP391.41
- 基于模糊理论的Web用户聚类的研究,TP311.13
- 基于人类视觉特性的结构相似度图像质量评价,TP391.41
- 基于社会化标注的网页检索研究,TP393.092
- 基于结构相似度与MTF的图像质量评价方法研究,TP391.41
- 基于可拓分类知识挖掘的复杂产品性能配置设计,TB472
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法 > 算法理论
© 2012 www.xueweilunwen.com
|