学位论文 > 优秀研究生学位论文题录展示

网络Flash资源文本信息提取研究

作 者: 郝帅
导 师: 孟祥增
学 校: 山东师范大学
专 业: 教育技术学
关键词: Flash动画 文本信息 关键词 轮廓文本
分类号: TP391.1
类 型: 硕士论文
年 份: 2014年
下 载: 4次
引 用: 0次
阅 读: 论文下载
 

内容摘要


伴随着互联网技术的进一步普及,国民信息技术应用能力作为发展的重难点而被特别强调,提高国民信息技术能力是教育技术学科建设的重点之一。Flash动画作为一种集文本、图形、图像、声音、视频、动画于一身的多媒体载体,凭借其制作简单、矢量格式放大不失真、体积小、交互丰富等特点日渐得到广泛的应用。Flash动画资源日益重要,但是获取Flash动画资源的检索研究还相对滞后。数据显示关键词检索的方式依然是互联网用户检索资源时使用的主要的手段。当前的Flash动画资源关键词检索是指针对资源所在网页进行分析,提取网页中的相关文本,分析得到的文本建立文本索引,这种方法有着明显的缺陷,主要是由于网页中的相关文本并不能很好的描述Flash动画的内容,造成了检索中的诸多问题。本研究立题网络Flash资源文本信息提取,主要研究内容为: Flash动画文件的结构和形成运作方式; Flash动画内部的文本信息的存在形式;Flash动画内部文本信息提取方法;Flash动画内部的文本信息的中文分词技术;设计相应的数据库收录分析得到的关键词形成索引。首先,充分研究了网络Flash动画文件中各类标签的结构内容和主要功能,通过研究标签了解Flash动画的运行方式和形成过程。网络中Flash动画文件的主要格式为SWF,是一种与XML文件结构相似的文件格式。Flash动画中所包含的各种媒体元素、视觉效果以及交互的实现都是依靠一套独立的二进制标签进行说明的。然后,研究Flash动画中文本信息分类并提出相应的提取方法。在充分分析Flash动画文件文本的定义方式、存储结构的基础上,依照其定义、结构、存储方式的的不同将Flash动画中的文本信息分为不同种类,即静态文本和动态文本、输入文本。又按照其定义的方式不同进一步细分为轮廓文本和设备文本,针对不同种类文本的存储特点找到不同的提取方式。接着,研究了Flash动画文本信息中文分词技术。在对中文分词技术进行大量研究工作之后,提出本研究的分词技术,将提取到的字符串在经历一系列的转码工作之后得到汉字字串,汉字字串通过基于词典、双向比较、词性标注统一的机械分词法进行分词处理,得到关键词之后对其进行进一步的过滤去重,以及划分处理。并将得到的关键词存储至设计好的索引数据库中。最后,研究检验系统的性能。以硕思精灵为标准参照,对七类Flash动画样本进行检验,从查全率和查准率两个纬度对系统的性能进行检验。本论文使用的开发工具为Visual C++6.0程序,在Windows XP操作系统环境中开发了Flash动画文本信息提取与标注平台程序模块,将Flash动画中的中文本信息提取出来进过分词等处理将结果存储至索引数据库中,为基于内容的Flash动画检索系统服务。

全文目录


摘要  6-8
ABSTRACT  8-10
第一章 绪论  10-18
  1.1 论文研究背景及研究意义  10-14
  1.2 研究现状  14-16
    1.2.1 网络多媒体资源检索分析现状  14-15
    1.2.2 网络 Flash 动画资源分析检索研究现状  15-16
  1.3 论文研究方法  16-17
  1.4 论文的章节安排  17-18
第二章 网络 Flash 动画文件结构特征  18-27
  2.1 网络 Flash 动画资源的分类  18
  2.2 网络 Flash 动画文件结构  18-23
    2.2.1 网络 Flash 动画文件的首部  19-20
    2.2.2 网络 Flash 动画文件主体部分  20-23
  2.3 网络 Flash 动画的产生机制  23-25
  2.4 本章小结  25-27
第三章 网络 Flash 动画中文文本信息处理  27-31
  3.1 网络 Flash 动画中文分词方法  27-28
  3.2 网络 Flash 动画信息处理分词词典的建立  28-29
  3.3 网络 Flash 动画中文文本词性标注技术  29-30
  3.4 本章小结  30-31
第四章 网络 Flash 动画中文文本信息提取  31-47
  4.1 网络 Flash 动画文件的预处理  31-32
  4.2 网络 Flash 动画文件中文本的种类  32-33
  4.3 网络 Flash 动画文件中文本信息的提取  33-41
    4.3.1 网络 Flash 动画文件中静态文本的提取  33-38
    4.3.2 网络 Flash 动画文件中动态文本的提取  38-41
  4.4 网络 Flash 动画文件文本处理  41-46
    4.4.1 网络 Flash 动画文件文本预处理  41-43
    4.4.2 网络 Flash 动画文件中文文本分词  43-44
    4.4.3 网络 Flash 动画文件中文文本过滤去重  44-45
    4.4.4 网络 Flash 动画文件中文词频统计与关键词划分  45
    4.4.5 网络 Flash 动画文件文本特征提取  45-46
  4.5 本章小结  46-47
第五章 网络 Flash 动画文本信息提取系统的设计与实现  47-64
  5.1 系统的结构  47-48
  5.2 系统主要模块的实现  48-54
  5.3 实验结果分析  54-64
第六章 总结与展望  64-66
  6.1 工作总结  64
  6.2 展望  64-66
注释  66-68
参考文献  68-70
攻读硕士学位期间的学术成果  70-71
致谢  71

相似论文

  1. 基于论文关键词聚类的用户兴趣模型细化方法研究,TP391.3
  2. 基于查询扩展的信息抽取技术研究及应用,TP391.1
  3. 基于词跨度的中文文本关键词提取及在文本分类中的应用,TP391.1
  4. 基于校园网的用户行为分析系统的设计与实现,TP393.18
  5. 关键词广告商标侵权问题研究,D922.294
  6. 外包数据库模式下中文文档密文检索研究,TP391.3
  7. 基于分类模型监测电子商务违禁信息的研究与实现,TP393.09
  8. 中国Flash动画民族化发展探讨,J954
  9. 基于汉字特征的中文文本数字水印算法研究,TP309.7
  10. 文本信息隐藏技术的研究,TP309
  11. 基于PPT文档的信息隐藏技术研究,TP309.7
  12. 话题追踪与演化分析技术研究,TP393.08
  13. 移动Flash流媒体关键技术的研究,TN919.8
  14. 项目教学法在中职FLASH动画制作教学中的应用研究,J218.7-4
  15. 刑事案件文本信息抽取研究,G353.1
  16. 面向网络文本的信息可信度研究,TP391.1
  17. 不同认知任务与判断形式对元理解监测准确性的影响,B842
  18. 以Flash动画技术推动动漫产业发展之研究,J218.7
  19. Flash动画的新媒体特性研究,J218.7
  20. 基于中文分词的图文自动匹配方法研究,P208
  21. 基于潜在语义分析的文本检索算法研究,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com