学位论文 > 优秀研究生学位论文题录展示

基于支持向量机的文本分类器设计与实现

作 者: 王雷
导 师: 马刚
学 校: 东北财经大学
专 业: 电子商务
关键词: 文本分类 统计学习理论 支持向量机 文本分类器
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 87次
引 用: 1次
阅 读: 论文下载
 

内容摘要


伴随着互联网的普及和电子商务应用的广泛深入,人们在享受网上冲浪的同时,也陷入了信息过载的困境,用户在大量的信息中难以找到自己需要的信息,商家也难以掌握网络上对自家商品的评论信息。由此,文本分类系统应运而生。文本分类器是文本分类系统的一个重要组成部分,具有良好的发展和应用前景,逐渐成为一个重要的研究内容。基于支持向量机的文本分类器是目前的研究重点,在很多方面较其他的分类器显示出突出的优势。但是基于SVM的文本分类器的还不够成熟,仍然存在一些问题,如系统的扩展性问题、使用的简易性和时间因素问题等。本文主要是对基于支持向量机的文本分类器的研究。本文首先通过查阅文献,总结了现有的文本分类器的特点,然后介绍了支持向量机和文本分类的基本理论,对文本分类器有了清晰的认识,最后是文本分类器的设计与实现部分。文本分类器主要包括三个部分:1、文本缩减经过分词和句法分析得到的文本信息做一些简单的缩减处理,则在进行文本训练和文本预测的时候能够改善结果。对文本数据进行缩减的目的在于:①避免一些特征范围过大而另一些特征范围过小。②避免在训练时为了计算核函数而计算内积的时候引起数值计算的困难。2、文本训练文本训练的主要目的就是构造文本分类器。训练过程是通过学习给定的文本分类体系相关的信息,使用特征权重算法计算出的特征项权重来构造出文本分类器,这样文本分类器就具有了区分既定类别的功能,也就建立起了分类模型。3、文本预测文本预测的关键就是构建的文本分类器必须是分类准确的。现在有很多文本分类器,在不同领域取得了很好的效果。如何更加客观的评价—个分类器的性能,是值得研究的方向之一。另外,本文还在最后通过实验对文本分类器的分类效果进行了评测和比较。

全文目录


相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于仿生模式识别的文本分类技术研究,TP391.1
  10. 互联网上旅游评论的情感分析及其有用性研究,TP391.1
  11. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  12. 基于图像的路面破损识别,TP391.41
  13. 基于支持向量机的故障诊断方法研究,TP18
  14. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  15. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  16. 基于车载3D加速传感器的路况监测研究,TP274
  17. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  18. 不匹配信道下耳语音说话人识别研究,TN912.34
  19. 基于文本挖掘的学者简历自动生成,TP391.1
  20. 基于特征选择的入侵检测研究,TP393.08
  21. 基于数据分布特征的文本分类研究,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com