学位论文 > 优秀研究生学位论文题录展示
应用条件随机场进行汉语词法分析、语块分析研究
作 者: 罗恒
导 师: 王继曾
学 校: 兰州理工大学
专 业: 计算机应用技术
关键词: 汉语词法分析 汉语语块分析 条件随机场 最大熵 序列数据标记
分类号: TP391.1
类 型: 硕士论文
年 份: 2006年
下 载: 269次
引 用: 2次
阅 读: 论文下载
内容摘要
介绍了词法分析、句法分析在自然语言理解研究中基础的、决定性的重要地位。针对目前词法分析、句法分析研究热点集中在基于规则方法和基于统计方法的联合应用,介绍了最大熵理论和最大熵理论对于自然语言理解研究的重要意义,并进一步介绍了条件随机场(以最大熵理论为驱动发展起来的一种用于对序列数据进行切分和标记的概率框架)。提出了应用条件随机场来构建统一的汉语词法分析。以往应用条件随机场进行汉语分词时,将分词转化为对汉字的标注。提出了使用词图作为基础的标记序列来完成汉语的词法分析,这样充分利用了现有的词典资源,在特征架的选择时也可以方便地融合语言知识。最后进一步讨论了将条件随机场应用到汉语语块分析之中。提出了未来关于应用条件随机场构建汉语词法语块分析模型的初步构想。
|
全文目录
摘要 7-8 Abstract 8-9 插图索引 9-10 附表索引 10-11 第1章 绪论 11-23 1.1 自然语言理解研究简介 11-12 1.2 汉语词法分析、语块分析的研究意义 12-13 1.2.1 自然语言理解研究的重要意义 12-13 1.2.2 汉语分析面临的困难 13 1.3 汉语词法分析、语块分析的国内外研究现状 13-21 1.3.1 汉语词法分析研究现状 13-17 1.3.2 语块分析研究现状 17-21 1.4 本文的主要研究内容 21-23 第2章 最大熵理论 23-28 2.1 最大熵理论的介绍 23-26 2.2 最大熵理论对于自然语言理解的意义 26-28 第3章 条件随机场 28-37 3.1 条件随机场简介 28-31 3.1.1 条件随机场的定义 28-30 3.1.2 条件随机场的参数估计 30-31 3.2 条件随机场与以往模型的比较 31-37 3.2.1 隐马尔科夫模型的缺点 31-34 3.2.2 最大熵马尔科夫模型的缺点 34-35 3.2.3 条件随机场的优点及不足 35-37 第4章 应用条件随机场进行汉语词法分析 37-43 4.1 以往的相关重要工作 37-39 4.1.1 最大熵汉字标注器 37-38 4.1.2 条件随机场汉字标注 38-39 4.2 以词图作为基本标记序列进行分析 39-40 4.3 相关特征框架的选择 40-43 第5章 应用条件随机场进行汉语语块分析 43-46 5.1 应用条件随机场进行汉语语块分析 43-44 5.2 汉语词法分析语句法分析一体化的构想 44-46 结论 46-47 参考文献 47-51 致谢 51-52 附录 A (攻读学位期间所发表的学术论文目录) 52
|
相似论文
- 领域实体属性及事件抽取技术研究,TP391.1
- 人物言论抽取与跟踪技术研究,TP391.1
- 城市轨道交通运营管理系统测试与评价方法研究,TP311.52
- 汉语框架自动识别中的歧义消解,TP391.1
- 基于条件随机场的中文分词技术的研究与实现,TP391.1
- 基于空间邻域词袋模型的图像标注技术,TP391.41
- 基于树型条件随场的特定域事件提取方法研究,TP391.1
- Co-V-R化合物的晶体结构及最大熵研究,TB383.3
- 带防护炸药在破片刺激下的仿真及安全评估,TJ510
- 融合词性信息的声学模型建模及研究,TN912.34
- 基于超声的筒状物体测厚系统研究,TH821.1
- 基于BAYES方法的固体火箭发动机可靠性评估,V435
- 结构动强度可靠性评估的研究,O242.1
- LPG/柴油混合燃料喷雾的研究,TK464
- 领域本体在中文命名实体识别中的应用研究,TP391.1
- 基于SSH和Lucene垂直搜索引擎研究,TP391.3
- 基于拼音标注的中文分词算法研究,TP391.1
- 基于最大熵模型的中文网页分类器设计和实现,TP393.092
- 传感器与遥感影像的辐射校正方法探索,TP75
- 基于熵理论的房地产投资风险决策方法研究,F293.3
- 基于最大熵原理的工程边坡参数估计及可靠度分析研究,TU43
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|