学位论文 > 优秀研究生学位论文题录展示

生物医学缩略语消歧

作 者: 杨华
导 师: 姚建民
学 校: 苏州大学
专 业: 计算机应用技术
关键词: 生物医学缩略语 缩略语识别 缩略语消歧 启发式方法 机器学习
分类号:
类 型: 硕士论文
年 份: 2011年
下 载: 27次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着计算机技术和生物技术的进步,当前生物医学领域文献正在爆炸性增长。文献中蕴含着最新的研究成果和丰富的生物医学知识。从生物医学文献中自动获取生物医学知识已经成为生物信息学研究的重要领域。生物医学缩略语消歧在生物医学和自然语言处理领域有着重要的理论和实践意义,在机器翻译和信息检索领域起着非常重要的作用。生物医学缩略语在文献中出现形式有两种:一种缩略语与其全称同时出现,另一种文献中只有缩略语出现。缩略语的出现形式决定了当前缩略语消歧的方法主要有两种:基于启发式方法,需要构建规则集;另一种是使用统计学和机器学习的方法,从大量的样本中推导出语言使用模型。由于生物医学文献的复杂性和多样性,生物医学缩略语在文献中的出现形式亦呈现出多样性。生物医学缩略语消歧是一个相当困难的任务。本文根据生物医学缩略语在文献中出现的形式,分别应用基于规则和基于机器学习的方法对生物医学缩略语消歧进行了深入研究。对于需要消歧的文档,本文首先根据缩略语识别法定位到缩略语;其次用基于规则和统计的方法对第一种形式的缩略语进行消歧;然后使用缩略语词典判断是否对此缩略语消歧;若此步没有找到缩略语正确全称,最后进行全局缩略语消歧。本文通过实验分析证明基于向量空间模型的方法最适用于第二种形式的生物医学缩略语消歧。生物医学缩略语消歧实验目前还没有统一的语料,以往研究都是针对文献中缩略语出现的其一种形式进行消歧,没有形成完善、高效的消歧系统。本文在自己构建语料的基础上进行实验证明:本文所构建的生物医学缩略语消歧系统,实现了所有形式的缩略语消歧,并且取得了较高的性能,达到了目前的较好水平。本文的研究和所取得的成果对今后缩略语消歧研究具有一定的参考价值。

全文目录


相似论文

  1. 自适应火灾应急预案调整研究,X928.7
  2. 英汉命名实体翻译方法研究,TP391.2
  3. 基于数据分布特征的文本分类研究,TP391.1
  4. 人类抗原肽载体结合力预测,R392.1
  5. 李群深层结构学习算法研究,TP181
  6. 机器学习算法在视频指纹识别中的应用研究,TP391.41
  7. 学习表达式的映射机制研究,TP181
  8. 蛋白质关系抽取中平面特征和结构化信息的研究,TP181
  9. 基于对象相关性的缓存策略的设计与实现,TP333
  10. 基于卡方检测和宏块类型统计的视频镜头边界检测算法的研究,TP391.41
  11. 生物医学命名实体识别研究,TP391.41
  12. 基于机器学习的图像边缘检测方法的研究与应用,TP391.41
  13. 基于排序学习的翻译自动评价方法的研究,TP391.2
  14. 基于支持向量机优化RBF神经网络的算法及应用研究,TP18
  15. 机器学习理论研究及其在车载导航系统中的应用,TN966
  16. CC-NUMA系统中Cache一致性协议模拟验证方法研究,TP306
  17. 基于SVM的医学图像分类的研究,TP391.41
  18. 个性化的人脸漫画与动画合成方法研究,TP391.41
  19. 有监督方法在词义消歧中的应用,TP391.1
  20. 基于情感计算的机器人学习系统研究,TP242

中图分类: >
© 2012 www.xueweilunwen.com