学位论文 > 优秀研究生学位论文题录展示
基于待消解项识别的全局优化共指消解方法研究
作 者: 漆舒汉
导 师: 王轩
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 共指消解 待消解项识别 全局优化 整数线性规划
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 26次
引 用: 0次
阅 读: 论文下载
内容摘要
本文主要研究了通过待消解项识别和全局优化改进共指消解的方法。通过结果反馈及参数调节,共指消解系统能够与不同性能的待消解项识别分类器结合产生不同的共指消解性能。本文将待消解项识别作为一个分类问题,使用最大熵方法构建模型,进行训练和分类。通过使用最大熵模型和70个特征,本文构建了一个消解项分类器。在构建消解项分类器的过程中,本文提出了一种参数调节的方法,通过设置语料比例和概率阈值两个参数,对可消解项进行识别,选取最优的消解项分类器分类器。在进行共指消解工作前,将待消解项识别作为过滤器,能够去除大量不可消解项。本文使用最大熵模型和65个特征构成共指消解的基准系统。这些特征包括词性、语法、语义、句法、形态学等语言学各个方面的信息。在共指消解前,使用消解项分类器对参与共指消解的短语进行识别,过滤掉不可消解项。由于不同性能的消解项分类器与基准系统结合能够产生不同的结果,所以本文从全局的角度出发,通过语料比例和概率阈值这两个参数对消解项分类器进行调节,使共指消解系统性能达到最优。本文还研究了另一种全局优化的方式:使用整数线性规划(ILP)对共指消解进行全局优化。将共指消解问题作为一个优化问题,引入线性规划的方法,对最大熵模型的输出进行进一步的全局优化。本文提出了一种松弛的传递性约束,在应用线性规划时作为可行域约束条件。本文在实验结果部分对基准系统、加入消解项分类器的共指消解系统、使用ILP全局优化的共指消解系统以及Soon和Ng的两种经典共指消解系统进行了比较。在对实验结果评测时,本文使用了MUC、B3、CEAF、BLANC等评测标准对共指消解系统进行评测,并且使用了这些评测标准的平均F值作为共指消解性能的最终衡量标准。本文还研究了使用不同参数的待消解项识别对总体共指消解系统产生的影响。实验结果显示使用了待消解项识别的共指消解系统在综合成绩上要优于其他参与对比的系统。在基准系统的基础上应用待消解项识别后,共指消解的平均F值由50.57%提升到53.35%。
|
全文目录
摘要 4-5 ABSTRACT 5-8 第1章 绪论 8-17 1.1 课题研究的背景和意义 8-11 1.2 国内外研究发展概况 11-16 1.3 本文的主要研究内容 16-17 第2章 共指消解 17-26 2.1 共指消解组成框架 17-18 2.2 训练实例生成 18-21 2.3 测试实例生成 21 2.4 分类模型和特征选择 21-24 2.5 实体合并 24-25 2.6 本章小结 25-26 第3章 待消解项识别 26-34 3.1 待消解项识别的概念 26 3.2 待消解项识别的相关研究 26-27 3.3 分类模型和特征选择 27-30 3.4 参数调节和全局优化 30-33 3.5 本章小结 33-34 第4章 基于整数线性规划的共指消解优化 34-40 4.1 整数线性规划 34-35 4.2 共指消解的优化 35-37 4.3 传递性约束 37-39 4.4 本章小结 39-40 第5章 实验结果和分析 40-49 5.1 引言 40 5.2 实验环境 40 5.3 待消解项识别实验结果 40-43 5.4 共指消解实验结果 43-48 5.5 本章小结 48-49 结论 49-51 总结 49-50 展望 50-51 参考文献 51-55 附录 55-60 附录1. 共指消解使用的全部特征 55-57 附录2. 待消解项识别所用特征 57-60 攻读硕士学位期间发表的论文及其它成果 60-62 致谢 62
|
相似论文
- 比式和问题的全局优化算法,O224
- 基于分割一致性的二维人体姿态估计,TP391.41
- 哈尔滨市群力新区土方调配优化研究,TU751
- 基于最大熵模型的中文实体关系自动抽取研究,TP391.1
- 全局优化理论几种算法的改进与研究,O224
- 基于遗传算法的组卷系统的研究与应用,O224
- 废旧木材逆向物流网络构建研究,F416.88
- 基于食物链生态进化算法的输电网扩展规划,TM715
- 融合粒子群的全局优化混合智能算法研究,TP18
- 功率半导体器件版图拼接技术研究,TN303
- 基于视觉认知的全局优化算法,TP301.6
- 基于实例动态泛化的共指消解及应用,TP391.1
- Petri网死锁迭代控制中若干问题研究,TP301.1
- 新一代电梯的调度算法研究,TU857
- 改进的差异进化算法求解高维全局优化问题研究,TP18
- 直接优化方法在核电厂堆芯换料中的可行性研究,TM623
- 电子废弃物逆向物流网络设计研究,F713.2
- 全局优化中辅助函数法的研究,O224
- 照明不均匀条件下光流计测的研究,TP391.41
- 面向共指消解的动态泛化机制研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|