学位论文 > 优秀研究生学位论文题录展示

基于蛋白质相互作用网络的聚类和稀疏点检测算法研究

作 者: 彭利红
导 师: 廖波
学 校: 湖南大学
专 业: 计算机系统结构
关键词: PPI网络 K-means聚类方法 相似度 AAMV法 稀疏点检测
分类号: TP301.6
类 型: 硕士论文
年 份: 2008年
下 载: 212次
引 用: 3次
阅 读: 论文下载
 

内容摘要


随着人类基因组测序的完成,对蛋白质结构和功能的研究成为基因组学研究的一大热点。研究证明,蛋白质在其功能组中很少以单个个体而存在,一般与功能相似的蛋白质之间存在相互作用。因此,我们可以通过对蛋白质相互作用(Protein-Protein interaction,PPI)网络的研究来预测其功能。本文将在基于PPI网络的聚类及稀疏点检测算法两方面进行研究:提出一种蛋白质功能预测算法——基于算术平均最小值(the Arithmetic Ave- rage Minimum Value, AAMV)的K-means聚类算法。首先,根据蛋白质之间的相互作用,通过人类AD(Alzheimer’s Disease)相关PPI网络图,得出蛋白质之间的关联矩阵;然后,利用AAMV法求得相似度矩阵;接着,鉴于误差平方和准则不能较好的对聚类进行收敛,提出了加权的误差平方和准则;最后,在相似度矩阵的基础上,利用加权的误差平方和准则进行有效收敛,利用K-means聚类方法对PPI网络中的蛋白质进行聚类与功能预测。提出PPI网络中的稀疏点检测算法——基于加权的相似系数和算法。首先,根据蛋白质之间的相互作用,通过人类AD(Alzheimer’s Disease)相关PPI网络图,得出蛋白质之间的关联矩阵;然后,利用最大最小值法求得相似系数矩阵;接着,由于相似系数和不能对PPI网络中的稀疏点进行更好的检测,因此,在相似系数的基础上提出加权的相似系数和方法。最后,根据输入的阈值,利用相似系数和算法得出PPI网络中的稀疏蛋白质。基于人类AD相关PPI网络图,利用基于AAMV的K-means算法对图中蛋白质进行聚类,其结果与Maryland Bridge法和Korbel法所得结果非常相似;利用聚类结果,对四个孤立蛋白质的功能进行预测。同时,利用加权的相似系数和算法对图中的稀疏蛋白质进行检测,实验结果表明:输入的阈值取值在0.01-0.16之间时,其精确度比较高。

全文目录


摘要  5-6
Abstract  6-12
第1章 绪论  12-21
  1.1 本文的研究目的  12
  1.2 项目来源  12
  1.3 选题背景和意义  12-17
    1.3.1 生物信息学概念  12-13
    1.3.2 生物信息学的主要研究内容  13-15
    1.3.3 生物信息学的研究目标和任务  15-16
    1.3.4 生物信息学的研究意义  16-17
  1.4 蛋白质组学研究  17-18
  1.5 本文的主要工作及结构安排  18-21
    1.5.1 本文的主要研究内容  18
    1.5.2 本文的组织结构  18-21
第2章 生物数据挖掘及PPI 网络概述  21-34
  2.1 生物数据挖掘  21-22
  2.2 聚类分析算法  22-25
    2.2.1 基于划分的方法  22-24
    2.2.2 基于层次的方法  24-25
    2.2.3 基于密度的方法  25
    2.2.4 基于网格的方法  25
    2.2.5 基于模型的方法  25
  2.3 PPI 及其网络  25-29
    2.3.1 大规模PPI 研究的目的及意义  25-26
    2.3.2 大规模PPI 的研究策略及方法  26
    2.3.3 大规模PPI 的研究现状  26-27
    2.3.4 PPI 网络  27-29
  2.4 孤立点挖掘方法  29-32
    2.4.1 基于统计的方法  29-30
    2.4.2 基于距离的方法  30-31
    2.4.3 基于偏离的方法  31
    2.4.4 基于密度的方法  31-32
  2.5 孤立点检测方法研究现状概述  32-33
  2.6 小结  33-34
第3章 基于PPI 网络的聚类算法  34-48
  3.1 引言  34-35
  3.2 相似性度量——AAMV 法  35-39
  3.3 聚类准则函数  39
  3.4 基于AAMV 的K-MEANS 聚类算法  39-42
    3.4.1 算法的处理流程  39-40
    3.4.2 算法描述  40-42
  3.5 实验及比较分析  42-46
    3.5.1 利用基于AAMV 的K-means 聚类算法进行聚类的结果  42-44
    3.5.2 利用Maryland Bridge 方法进行聚类的结果  44
    3.5.3 利用Korbel 方法进行聚类的结果  44-45
    3.5.4 实验结果的分析比较  45-46
  3.6 小结  46-48
第4章 基于PPI 网络的稀疏点检测  48-59
  4.1 引言  48-49
  4.2 相似度定义  49-51
  4.3 相似系数和  51-52
    4.3.1 相似系数和  51-52
    4.3.2 加权的相似系数和  52
  4.4 基于PPI 网络的稀疏点检测算法  52-55
    4.4.1 算法的处理流程  52-53
    4.4.2 算法描述  53-55
  4.5 实验及其分析  55-58
    4.5.1 实验结果  55-56
    4.5.2 实验结果的分析  56-58
    4.5.3 算法时间复杂度分析  58
  4.6 小结  58-59
结论  59-61
参考文献  61-65
致谢  65-66
附录A 攻读硕士期间发表的论文和参加的项目  66

相似论文

  1. 基于句法特征的代词消解方法研究,TP391.1
  2. 多邮件自动文摘的关键技术研究,TP391.1
  3. 基于相似度计算的编程题自动评判方法研究,TP312.1
  4. 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
  5. WordNet和《中国分类主题词表》的映射研究,G254
  6. 基于本体的食品投诉文档文本聚类研究,TP391.1
  7. Web环境下基于语义模式匹配的实体关系提取方法的研究,TP391.1
  8. 智能答疑系统中句子相似度计算的研究与应用,TP391.1
  9. 应用于搜索引擎的人物分类系统设计与实现,TP391.3
  10. 基于CBR的离散模拟模型可复用性研究,TP301.6
  11. 面向论坛信息文本的有效数据抽取研究,TP391.1
  12. 基于链接重要性的动态链接预测算法研究,TP393.03
  13. 社会化网络中的推荐算法及其应用,TP391.3
  14. 网络环境下人才知识结构智能交互生成方法研究,TP391.6
  15. 基于本体的智能电网知识检索系统,TM76
  16. 基于内容的大规模数字图像检索技术研究,TP391.41
  17. 基于模糊理论的Web用户聚类的研究,TP311.13
  18. 基于人类视觉特性的结构相似度图像质量评价,TP391.41
  19. 基于社会化标注的网页检索研究,TP393.092
  20. 基于结构相似度与MTF的图像质量评价方法研究,TP391.41
  21. 基于可拓分类知识挖掘的复杂产品性能配置设计,TB472

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法 > 算法理论
© 2012 www.xueweilunwen.com