学位论文 > 优秀研究生学位论文题录展示
纳税信用等级评定分类方法应用研究
作 者: 徐邵兵
导 师: 胡学钢;谈平
学 校: 合肥工业大学
专 业: 计算机技术
关键词: 纳税信用等级评定 数据挖掘 分类 决策树 窗口技术
分类号: F224
类 型: 硕士论文
年 份: 2007年
下 载: 120次
引 用: 0次
阅 读: 论文下载
内容摘要
税收是国家财政收入的主要来源,也是国家调节经济发展的重要手段。税收信用是社会信用体系的重要组成部分,诚信纳税在一定程度上反映了社会信用状况。目前,我国的税收信用体系的建设还处于创立阶段,纳税信用等级评定还处在手工或计算机模拟手工评定阶段。税收信息化的发展为纳税信用评定沉积了大量税收业务数据,如何应用数据挖掘技术对进行知识发现,实现纳税信用等级评定的自动化和智能化,是当前税收信息化工作难点之一。本文针对这一课题,结合数据挖掘的分类技术进行研究,主要工作如下:(1)分析总结了税务系统纳税信用等级评定的目的、内容、标准、激励、监控和现状,提出了利用决策树算法来解决纳税信用等级手工评定问题的思路。(2)讨论了数据准备的目标、任务、技术及方法,并按照数据准备的过程对纳税信用等级评定训练数据进行数据选择、数据预处理和数据转换,形成数据挖掘的准备数据。(3)在应用研究过程中,针对C4.5算法的连续属性离散化步骤对于实际的纳税信用等级评定数据计算效率不高,提出了基于经验值窗口分割技术的连续属性离散化算法,应用结果证明改进算法性能良好,符合税务系统应用实际。(4)将改进的C4.5算法应用到纳税信用等级评定中,实现了对纳税人进行纳税信用等级的自动评定,提高了纳税信用等级评定工作的效率,减少了该项工作的人为干扰因素,使得整个评定工作更显公平、公正。(5)基于上述研究,实现了原型实验系统,从理论和实验上证明了所提出的算法的正确性和有效性。
|
全文目录
摘要 5-6 Abstract 6-12 第一章 绪论 12-17 1.1 课题背景 12 1.2 纳税信用等级评定内容、标准及有关要求 12-15 1.2.1 纳税信用等级评定的内容和标准 13-14 1.2.2 纳税信用等级评定的激励与监控 14-15 1.3 税务系统纳税信用等级评定现状 15 1.4 本文研究内容及结构 15-16 1.5 本章小结 16-17 第二章 分类规则发现 17-31 2.1 KDD 17-19 2.1.1 KDD定义 17-18 2.1.2 KDD与相关技术的比较 18-19 2.2 数据挖掘 19-22 2.2.1 数据挖掘的任务 19-21 2.2.2 数据挖掘当前的研究与应用 21-22 2.3 分类问题 22-25 2.3.1 什么是分类 22-23 2.3.2 分类研究的常用模型 23-25 2.4 决策树分类算法 25-29 2.4.1 ID3算法 25-27 2.4.2 C4.5算法 27-28 2.4.3 其他决策树算法 28-29 2.4.4 属性离散化 29 2.5 本章小结 29-31 第三章 数据准备 31-39 3.1 目标和任务 31 3.2 数据准备技术及方法 31-35 3.2.1 数据清理 32 3.2.2 数据集成和变换 32-34 3.2.3 数据归约 34-35 3.3 纳税信用等级评定的数据准备 35-38 3.3.1 数据选择 35-36 3.3.2 数据预处理 36-37 3.3.3 数据转换 37-38 3.4 本章小结 38-39 第四章 改进C4.5算法在纳税信用等级评定中的应用 39-47 4.1 C4.5算法分析 39-40 4.2 基于WPEV技术的C4.5连续属性离散化改进算法 40-41 4.3 改进C4.5算法在纳税信用等级评定中的应用 41-44 4.3.1 决策树生成 41-42 4.3.2 剪枝 42 4.3.3 规则知识描述 42-43 4.3.4 规则解释 43 4.3.5 决策树验证及应用 43-44 4.4 改进前后算法的应用结果比较 44-45 4.5 进一步工作 45 4.6 本章小结 45-47 第五章 实验系统介绍 47-53 5.1 引言 47 5.2 系统结构及实现 47-50 5.2.1 数据准备模块 48-50 5.2.2 数据挖掘模块 50 5.3 系统主要函数介绍 50-52 5.4 本章小结 52-53 第六章 结束语 53-55 6.1 本文总结 53 6.2 工作展望 53-55 参考文献 55-58 研究生期间主要科研工作及其成果 58
|
相似论文
- K公司计划及预测改进对于合理库存配置的研究,F224
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 基于串核的蛋白质分类算法的研究与实现,TP301.6
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 多样性密度学习算法的研究与应用,TP181
- 基于支持向量机的故障诊断方法研究,TP18
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 计算智能在数字化卷烟叶组配方中的应用研究,TS44
- 基于中国土壤系统分类的土壤类型和界线确定研究,S155
- 弯孢属种分子鉴定体系的建立及其在疑难种上的应用,Q949.32
- 基于视觉的番木瓜外观品质检测技术研究,S667.9
- 西藏生防芽孢杆菌鉴定及其脂肽化合物分析,S476.1
- 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
- 基于HJ卫星混合像元分解的水稻生长监测技术研究,S511
- 基于连锁图的QTL综合分析方法研究,S562
- Bicluster数据分析软件设计与实现,TP311.52
中图分类: > 经济 > 经济计划与管理 > 经济计算、经济数学方法 > 经济数学方法
© 2012 www.xueweilunwen.com
|