学位论文 > 优秀研究生学位论文题录展示
基于k-means聚类马氏链的中国股市实证分析
作 者: 孙永发
导 师: 郝志峰
学 校: 华南理工大学
专 业: 概率论与数理统计
关键词: k-means聚类 股票指数 马氏链 转移概率
分类号: F832.51
类 型: 硕士论文
年 份: 2011年
下 载: 69次
引 用: 0次
阅 读: 论文下载
内容摘要
多年来,许多股市预测者们尝试了各种各样的模型,方法来预测股市,诸如时间序列模型,神经网络模型,复杂网络,马尔可夫以及组合预测方法等等.本文的研究内容和研究成果主要包括以下两个方面:第一,本文将数据挖掘方法中的聚类分析技术和马尔可夫模型结合起来,本文主要预测沪深两市指数连续两天的变化情况,随着预测天数的增加,状态数随预测天数呈指数增长.这时,每个状态内的数据会出现不平衡.聚类分析的目地是从数据量的选取的角度出发的,数据量的不同会导致严重的不平衡问题,所以聚类分析是为了去除不平衡问题.第二,本文从条件概率的角度定义了一个很重要的统计量即噪声信息熵.这个统计量具有非常重要的意义,就是它只跟初始状态有关,而跟下个状态无关.在此基础上,提出了一个很重要的J值函数.此函数可以用来评价在相同数据量的情况下,所建模型的噪声信息,并实证分析了J值函数和上证指数,深圳成指波动性的关系,结果显示函数J和股市波动性有很大关系,说明由此函数定义的噪声信息是有现实意义的,可以度量股市波动性的大小,给出了一种量化关系.此外还分析了函数J和模型正确性的关系,指出函数J和模型正确率没有线性关系.上述两个方面都是本文的创新之处,本文的一个很大的不足之处就是模型的预测准确度会随着数据选取的变化而不同,从数据选取的角度本文指出了数据选取最佳的年份.正因为如此,模型不具有很好的可塑性,鲁棒性,这是往后的研究者们的工作重心之所在.总体上来说,此模型对上证指数的预测比深圳成指的预测正确率要高,意义也更大.从经济学角度可以使用此模型去预测那些对上证指数影响很大的权重股,可以为投资者购买这些股票提供科学合理的投资建议,比如何时购买,何时停时,这些都是蕴含在股票市场中的奥秘.
|
全文目录
摘要 5-6 Abstract 6-9 第一章 绪论 9-12 1.1 选题背景及研究意义 9-11 1.1.1 国内外研究现状 9-10 1.1.2 研究意义 10-11 1.2 本文的组织结构 11-12 第二章 k-means 聚类和马尔可夫过程 12-19 2.1 k-means 聚类算法 12-14 2.1.1 聚类算法过程 12-13 2.1.2 聚类算法统计量 13-14 2.2 马尔可夫过程 14-16 2.2.1 基础知识 14-16 2.2.2 马氏链与中国股市的关系 16 2.3 马尔可夫链预测模型 16-17 2.4 马尔可夫链的特征 17-18 2.5 本章小结 18-19 第三章 基于k-means 聚类马氏链的股市预测 19-30 3.1 预测模型算法 19 3.2 上证指数预测 19-26 3.2.1 数据处理 19-20 3.2.2 聚类 20 3.2.3 马尔可夫模型 20-26 3.3 深圳成分指数和不同行业个股的预测 26-27 3.4 平稳分布 27-28 3.5 本章小结 28-30 第四章 中国股市波动性分析 30-40 4.1 噪声信息 30-31 4.2 波动性函数 31-33 4.3 波动性分析 33-36 4.4 波动函数和模型预测正确率的关系 36-37 4.5 数据量选取问题 37-38 4.6 本章小结 38-40 结论 40-41 参考文献 41-44 附录 44-47 攻读硕士学位期间取得的研究成果 47-48 致谢 48-49 答辩委员会对论文的评定意见 49
|
相似论文
- 有转移密度函数的HMM隐状态估计与参数估计,O211.62
- 模m的非齐次树上马氏链场的若干强律,O211.62
- 具有去边机制的随机—无标度混合演化网络度分布,O157.5
- M为随机变量的BA模型的度分布,O211.5
- 我国农业产值结构的预测问题研究,F224
- 基于像素级多特征的图像分割方法研究,TP391.41
- 两类含有时变转移概率的Markov跳跃系统的研究,TP13
- 非齐次马氏链的若干遍历性问题,O211.62
- 有限渐近循环马氏链样本相对熵率存在定理和散度率,O211.62
- 违约过程为马氏链的信用违约互换定价研究,F832.5
- 整的自仿射瓦集与自仿射测度及有限型条件的刻画,O415.5
- 基于遥感图像的快速城市建模中的图像处理技术,TP391.41
- 支持向量机及金融应用,F830
- Ad hoc网络可生存性研究,TN929.5
- 马尔科夫链在中长期负荷组合预测中的应用,F407.61
- 基于因果图的灰色马氏链及其在智能信号控制灯中的应用研究,U491.51
- 基于概率神经网络和K-means算法的纳税评估,F224
- 基于视频的人脸表情识别,TP391.41
- 树上奇偶马氏链场及三次循环树指标马氏链的强大数定律,O211.62
- 多状态风险因子下的死亡率模型在寿险中的应用,F840.6
中图分类: > 经济 > 财政、金融 > 金融、银行 > 中国金融、银行 > 金融市场
© 2012 www.xueweilunwen.com
|