学位论文 > 优秀研究生学位论文题录展示
企业邮件监管系统的设计与实现
作 者: 钱立毅
导 师: 王树梅
学 校: 南京理工大学
专 业: 计算机技术
关键词: 贝叶斯 中文分词 图片文字识别 邮件代理
分类号: TP393.098
类 型: 硕士论文
年 份: 2012年
下 载: 24次
引 用: 0次
阅 读: 论文下载
内容摘要
近年来随着企业信息化的发展,电子邮件在企业中扮演着越来越重要的角色,极大的方便企业员工的日常交流与共享信息。但是随之而来的企业重要信息安全问题也日益突出,怎样保护企业的信息内容安全同时又不影响员工的日常交流成为一个亟待解决的问题。本文在综合考虑现有图片文字识别和中文分词解决方案的基础上结合贝叶斯过滤算法实现了一个适合企业应用的邮件内容监管系统。本系统部署在邮件客户端和SMTP服务器之间,转发邮件内容并对邮件内容进行扫描过滤,邮件内容包括普通文本和图片附件。对于图片附件,系统先对图片中的文字识别转换成文本。系统采用中科院ICTCLAS分词系统对文本内容进行分词,并将分词结果按词性和词频排序,选择其中部分作为贝叶斯算法的特征串。贝叶斯算法分别按伯努利模型和多项式模型实现,具体过滤时可有用户选择哪种模式。同时系统在去除停用词方面采取了通用停用词和专用停用词相结合的方法,专用停用词表可以由用户维护。系统主要包括邮件的代理转发模块、内容提取模块、内容预处理模块、内容过滤模块、系统参数配置模块和系统日志模块。系统在模拟环境中测试效果良好,具有广泛的应用前景。
|
全文目录
摘要 3-4 Abstract 4-5 目录 5-7 1 绪论 7-12 1.1 背景描述 7-9 1.1.1 电子邮件的发展 7 1.1.2 企业邮件的隐患 7-9 1.2 邮件监管的主要技术 9-10 1.3 本文的主要解决的问题及组织结构 10-12 2 系统需求分析 12-18 2.1 用户需求分析 12-13 2.1.1 用户需求 12 2.1.2 现有过滤系统的特点与不足 12-13 2.2 功能需求分析 13-16 2.2.1 用户登录与注册 13-14 2.2.2 系统参数配置 14 2.2.3 邮件集的训练与特征库更新 14-15 2.2.4 系统的过滤 15 2.2.5 系统日志管理 15-16 2.3 性能需求分析 16 2.4 可行性分析 16-17 2.5 本章小结 17-18 3 系统总体分析与设计 18-33 3.1 系统目标 19 3.2 系统的总体框架 19-21 3.3 系统的模块设计 21-23 3.3.1 邮件代理转发模块 21-22 3.3.2 邮件内容提取模块 22 3.3.3 邮件内容预处理模块 22 3.3.4 邮件内容过滤模块 22 3.3.5 系统参数配置模块 22-23 3.3.6 系统日志模块 23 3.4 关键技术 23-33 3.4.1 图片的文字识别 23-26 3.4.2 中文分词 26-28 3.4.3 特征串的选择和参数的设置 28 3.4.4 过滤模型的建立 28-33 4 系统详细设计与实现 33-55 4.1 邮件代理转发模块 33-37 4.1.1 相关协议的介绍 33-36 4.1.2 代理转发功能的分析 36-37 4.1.3 代理转发功能的实现 37 4.2 邮件内容提取模块 37-44 4.2.1 邮件格式 38-41 4.2.2 内容提取功能的分析 41-42 4.2.3 内容提取功能的实现 42-44 4.3 邮件内容预处理模块的实现 44-48 4.3.1 图片文字识别 45-46 4.3.2 中文分词 46-48 4.4 邮件内容过滤模块 48-52 4.4.1 过滤功能的分析 48-50 4.4.2 过滤功能的实现 50-52 4.5 系统参数配置模块 52-54 4.6 系统日志模块的实现 54-55 5 系统的部署与测试 55-60 5.1 系统的部署 55-56 5.2 系统的测试 56-60 5.2.1 测试环境 56-57 5.2.2 测试评价指标 57 5.2.3 测试结果分析 57-59 5.2.4 与同类系统比较 59-60 6 总结与展望 60-61 6.1 本文的工作总结 60 6.2 本系统的不足和进一步改进 60-61 致谢 61-62 参考文献 62-64
|
相似论文
- 多传感器信息融合及其在可穿戴计算机上的应用,TP202
- 黄磷储罐区安全评价方法研究,TQ126.317
- 基于聚类分析的P2P流量识别算法的研究,TP393.02
- 黑麦草(Lolium perenne L.)代谢QTL定位与代谢网络构建,S543.6
- 语音信号的压缩感知研究及其在语音编码中的应用,TN912.3
- 城市轨道交通运营管理系统测试与评价方法研究,TP311.52
- 类药性和生物利用度的理论预测研究,R914
- 基于贝叶斯理论的社会化标注主题聚类模型研究,C93
- FPSO在石油卸载过程中的风险评估,U698
- 基于鱼眼相机的运动物体检测和跟踪,TP391.41
- 有序Probit模型的非参贝叶斯统计,O212.8
- 基于状态空间模型的赔款准备金的研究,F842.3
- 基于压缩感知的认知无线电频谱检测技术及其研究,TN925
- 认知无线电系统合作频谱感知中感知数据错误化攻击防御技术,TN925
- 基于条件随机场的中文分词技术的研究与实现,TP391.1
- 基于改进的非参数回归交通流量预测方法,F570
- 基于压缩感知的多径信道估计及其研究,TN925
- 主观题自动评分技术研究,TP391.1
- 基于双目立体视觉的水下三维重建,TP391.41
- 基于无线传感器网络的智能家居安全监测系统的研究与应用,TP273.5
- 重构算法在OFDM信道估计中的应用研究,TN919.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 电子邮件(E-mail)
© 2012 www.xueweilunwen.com
|