学位论文 > 优秀研究生学位论文题录展示
一种应用于文本信息隐藏的组块分析算法的设计与实现
作 者: 魏媛
导 师: 房鼎益
学 校: 西北大学
专 业: 计算机系统结构
关键词: 信息隐藏 自然语言信息隐藏 自然语言处理 组块识别
分类号: TP391.1
类 型: 硕士论文
年 份: 2012年
下 载: 35次
引 用: 1次
阅 读: 论文下载
内容摘要
随着自然语言信息隐藏技术的广泛应用及深入研究,文本信息隐藏的隐藏容量和隐蔽性成为了目前自然语言信息隐藏技术的主要问题。这些问题不仅对隐藏算法提出了要求,同时也对自然语言的识别分析提出了更大的挑战。使得自然语言的识别分析不仅要对语法及句法进行分析识别,还要对自然语言的语义及语用进行识别。本文所研究的技术是针对自然语言信息隐藏的载体文本进行自然语言组块识别分析,本研究学习了计算语言学和自然语言处理方面的知识,提出了一种自然语言组块识别分析的方法,这种方法为了避免单纯用统计或是用规则的识别方法存在的缺点,将两种不同的识别方法进行了结合。该方法中的自底向上组块分析算法不仅对自然语言进行语法及句法的分析,还对自然语言的语义及语用进行分析识别。同时,本文提出的组块分析识别方法对于大型自然语言的语料的分析识别来说,该方法的工作效率也被作为重要的研究内容,通过对该方法的实验证明,本文提出的方法的工作效率得到了很大的提高。最后,本研究设计并实现了一个多步骤融合的自底向上组块分析方法的原型系统。这个原型系统在组块分析过程中可分为两大部分:第一部分是SVM的初始组块识别过程,我们将SVM的多类别分类机制应用到了自然语言识别中,并修改了SVM的特征向量的选取。第二部分是自底向上组块分析算法的组块识别过程,这部分则是为了弥补SVM识别的不足并且要得到更好的识别效果。实验表明本文提出的多步骤融合的自底向上组块分析方法不仅能够较好的识别语法和句法信息,而且对自然语言的语义及语用信息的识别具有较高的正确率和召回率,同时系统还具有良好的工作效率。
|
全文目录
摘要 3-4 Abstract 4-5 目录 5-7 第一章 绪论 7-23 1.1 本文研究意义及应用背景 7-9 1.1.1 本文研究的意义 7-8 1.1.2 本文应用背景 8-9 1.2 信息隐藏概述 9-12 1.2.1 信息隐藏定义及分类 9-10 1.2.2 信息隐藏系统的特征 10-11 1.2.3 数字水印系统 11-12 1.2.4 数字水印系统模型 12 1.3 自然语言信息隐藏技术概述 12-14 1.3.1 自然语言信息隐藏技术 12-14 1.3.2 自然语言信息隐藏存在的问题 14 1.4 自然语言组块分析识别技术 14-20 1.4.1 浅层句法分析概述 14-15 1.4.2 组块识别的方法 15-20 1.5 本文组块识别方法的研究内容 20-22 1.6 本章小结 22-23 第二章 支持向量机的初始组块分析 23-35 2.1 机器学习概述 23-25 2.1.1 机器学习概念及系统结构 23-24 2.1.2 机器学习方法的分类 24-25 2.2 支持向量机基本原理 25-31 2.2.1 SVM方法的特点 25-26 2.2.2 SVM的线性情况 26-28 2.2.3 SVM的非线性情况 28-30 2.2.4 SVM的多类别分类问题 30-31 2.3 初始组块分析的SVM应用 31-32 2.4 本章小结 32-35 第三章 自底向上组块分析算法 35-43 3.1 组块定义 35-37 3.1.1 组块类型现状 35-36 3.1.2 本文组块的定义 36-37 3.2 自底向上分析法思想 37-38 3.3 自底向上组块识别算法 38-41 3.3.1 算法过程 39-40 3.3.2 算法特点 40-41 3.4 本章小结 41-43 第四章 多步骤融合的自底向上组块分析算法的原型系统 43-55 4.0 多步骤融合的自底向上组块分析方法 43-44 4.1 原型系统开发环境 44-45 4.2 核心功能模块设计与实现 45-52 4.2.1 核心功能模块设计 45-51 4.2.2 系统实现 51-52 4.3 本章小结 52-55 第五章 实验与数据 55-61 5.1 组块分析评价参数 55 5.2 实验设计及数据分析 55-58 5.2.1 SVM的初始组块分析 56-57 5.2.2 多步骤融合自底向上组块分析方法的组块识别 57-58 5.3 本章小结 58-61 总结与展望 61-63 参考文献 63-65 攻读硕士学位期间取得的科研成果 65-67 致谢 67
|
相似论文
- 矢量CAD电子图纸保护系统研究,TP391.72
- 词义消歧语料库自动获取方法研究,TP391.1
- 图像信息隐藏技术的应用研究,TP309.7
- 基于图像的信息隐藏技术研究,TP309.7
- 信息隐藏技术在HTML标签中的应用,TP309.7
- 针对生物认证的图像相关性分析研究,TP391.41
- 基于独立分量分析和噪声可见性函数的信息隐藏方法研究,TP391.41
- 基于视觉注意力的视频水印方法研究,TP309.7
- 中文名词性谓词的语义角色标注研究,TP391.1
- 基于离散小波变换的图像水印算法研究,TP309.7
- 基于指纹识别和信息隐藏的网络身份认证系统的设计与实现,TP311.52
- 心电图诊断报告的结构化方法研究,R444
- 学术主页信息抽取系统的研究,TP393.092
- 基于即时语音通信的信息隐藏技术研究,TP309
- 基于自然语言打印机人机交互方法研究与实现,TP11
- 基于手机微博的隐蔽通信技术研究,TP393.08
- AraOntoLT:基于阿拉伯语文本的本体学习框架,TP391.1
- 基于JPEG图像的隐写编码和盲检测技术研究,TN918.2
- PS类图像与隐写图像的分类,TP391.41
- 低码率视频信息隐藏技术研究,TN919.8
- GIF和BMP图像信息隐藏算法研究,TP309
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|