您好,欢迎来到华佗小知识。
搜索
您的当前位置:首页基于BP神经网络的股市大小盘风格轮动预测

基于BP神经网络的股市大小盘风格轮动预测

来源:华佗小知识
第36卷第3期

文章编号:1006-9348 (2019 )03-0239-04

计算机仿真

2019年3月

基于BP神经网络的股市大小盘风格轮动预测

郭怡然,王秀利

(财经大学信息学院,北京100081)

摘要:针对我国股票市场上明显的大小盘风格轮动特征,提出了大小盘风格轮动预测模型,用于预测未来大小盘股票的相对 收益。模型采用基于遗传算法优化权重的BP神经网络算法,以上证50指数和中证500指数代表大小盘股票表现进行分 析,从指数收盘价和成交量数据中提取不同信息作为输人指标,对比不同指标预测效果的优劣。结果发现BP神经网络模型 对中期风格轮动有比较好的预测效果,且提取价量数据特征进行预测比用原始数据直接预测正确率更高。关键词:神经网络;遗传算法;股市风格 中图分类号:TP391

文献标识码:B

Stock Market Style Rotation Prediction Based on BP Nerve Network

GUO Yi-ran,WANG Xiu-li

(School of Information, Central University of Finance and Economics, Beijing 100081, China)

ABSTRACT : Aiming at the obvious rotation of the style between large-sized and small-sized stocks in our country, a scale style rotation prediction model is proposed to predict the relative returns of large and small stocks in order to earn excess returns. The model uses the BP neural network algorithm which adopts genetic algorithm to optimize the weight. The analysis was based on the Shanghai Stock Exchange 50 Index representing large — sized stocks and the China Securities 500 Index representing small-sized stocks. This paper extracted several features from the index price data as the inputs of the model and compared the pros and cons of these features. The results show that the BP neural network model based on genetic algorithm has an excellent performance, and the accuracy is higher to use features as input than the original data.

KEYWORDS:Nerve network; Genetic algorithm; Stock market style

i引言

在我国股票二级市场上,有明显的风格轮换的特征[n。

跌时,风险更大。大盘股较为稳定,但在市场稳中向好时,持 有大盘股收益相对较低。投资者追求的是高收益、低风险, 市场风格的切换也就是投资者对于市场未来预期的变化,基 于对市场的不同预期,对大盘股或小盘股有不同偏好,导致 大小盘风格轮动的形成。经研究发现,中国股市有明显的中 期风格动量轮转,相对于持续持有小盘股或大盘股,大小盘 风格轮换策略收益更高[2]。同时,由于上证50指数成分股 均为大盘股,中证500指数偏小盘股,且两者均有对应股指 期货,可以进行卖空操作,因此可以通过两指数的股指期货 对冲,进行大小盘风格套利。

目前对于股市风格的研究,多采用协整检验、向量自回 归模型和格兰杰因果检验等时域分析方法来完成,采用机器 学习算法分析预测股市风格轮动的研究较少。股市预测为 非线性预测,采用非线性的方法有更好的效果m。本文将采 用基于遗传算法改进的BP神经网络来进行分析,基于上证 50指数以及中证500指数的价量信息,计算相关指标,滚动 预测未来一段时间内的大小盘风格轮动情况[<]。

风格是指将股票从市值规模、行业、板块等角度进行分类,相 类似的股票分为一组,不同组股票具有不同风格。关于风格 的研究,在上世纪90年代就开始出现,并且当时在欧美市场 出现了诸多基于风格的投资基金,均有不错的收益。我国A 股股票也有大小盘及行业板块的区分,并且在不同市场时 期,不同风格会出现收益高低的差异。相较于行业风格轮 动,大小盘风格轮动更为明显且有迹可循,在某段时期大盘 股或小盘股收益会明显优于另一类,且这种优势在一段时间 后会切换,因此可以通过在不同时期配置不同风格的股票组 合,赚取超额收益。大小盘投资风格轮动的出现源于投资者 对于不同市场出现的不同反映。历史经验表明,小盘股一般 具有高成长性,从长期来看,小盘股相对大盘股有收益溢价, 但小盘股波动相对较大,不稳定,在熊市尤其是市场急剧下

收稿日期:20丨8-01-05

239 —

2风格预测模型

人工神经网络是模仿生物大脑神经元,进行分布式并行

初始化种群

2.1 BP神经网络原理

信息处理的算法,可用于分类和预测,对于拟合非线性函数, 具有较好的效果,且具有自适应、自学习和容错性。BP神经 网络是应用最为广泛的神经网络算法。它一般由输人层、隐 藏层、输出层构成。输人层神经元个数与输入因子数量相 同,输出层神经元个数与结果数相同。它根据计算结果与标 准结果的误差,逆向传播修改神经网络的权重,直到误差达 到一定精度为止。三层BP神经网络模型如图1所示。

入层

隐藏层

输出层

图2遗传算法优化权重流程

4)选择运算

根据个体的适应度,将较好的个体按照一定规则遗传到 下一代。本文选择轮盘赌的方法,设群体总数为每个个 体的适应度为则每个个体被选中的概率为

PifihM 1

(2)

^ 1

将当前群体中所有个体适应度累加,生成一列随机数,

图1 BP神经网络

长度为群体规模M,将其从小到大排序,对每个随机数进行 判断,若随机数小于当前适应度累加值,则将当前个体遗传

BP神经网络优化步骤如下:1) 预测值;

2) 将预测值与训练样本真实值进行比较,计算误差;3) 根据误差对神经网络的权值进行调整;4)

到下一代。

将两个染色体基因进行交叉,生成两个新的个体。交叉 以概率进行,交叉的过程如公式所示。

lx\\*' = ax\\ + (1 - a)x2

初始化网络权值,输人训练集,计算网络输出结果,即 5) 交叉运算

重复前三步步骤直至误差收敛到期望值,或训练次

(3)

= (1 - a)x\\ + ax'2a是0到1的随机数。6) 变异运算

变异运算是对某个个体的基因直接进行变动,增加搜索

数达到预设上限。

2.2遗传算法优化的神经网络模型

传统BP神经网络容易陷人局部最优解,为了提高算法 的全局捜索能力,考虑采用遗传算法进行优化[5]。遗传算法 是一种启发式算法,仿照生物进化过程,采取优胜劣汰的方 式,寻找最优解。它具有较好的全局搜索能力,将其与BP神 经网络结合,采用遗传算法优化神经网络的权重,可以较好 解决陷人局部最优的问题。

用遗传算法优化神经网络权值,若采用传统的二进制编 码,计算量过于庞大,因此本文采用实数编码的遗传算法[6]。

实数编码遗传算法的求解过程如图2所示。1)

范围,使群体具有更大多样性,防止陷人局部最优。变异以 概率进行,变异的过程如公式所示

*'*' = x' + h * (max - x') * r

rand mod 2=0 x' - k* (x' - min) rand mod 2 = 1

(4)

广为0到1的随机数,t为0到1的系数为权重的最

大值,mire为权重的最小值。

对个体进行编码,传统编码方法为二进制编码,但是 7) 计算经过选择、交叉和变异过程之后的新种群的适

应度,重复上述三个操作,直至误差低于预期阈值或达到最 大迭代次数[7]。

二进制不能很好地表示实数,所以在表示网络权值时,采取 浮点数编码。将所有权值连在一起,构成一个个体。

2) 初始化种群。随机生成规模为M的初始种群。3)

通过适应度函数计算适应度。适应度即表示当期种 3

基于股票指数的风格预测仿真

中国股市的大小盘风格,可以通过两支最典型的股票指

群中每个个体的优劣,本文的适应度函数采用以下方式

E =

~ ct)2 ⑴数反映。上证50指数成分股均为规模大、流动性好的最具 代表性的优质大盘股票;中证500指数成分股为沪深证券市

其中h为目标值A

240 —

为计算值,n为样本数。

场内小市值公司。两支指数关注度极高,且均拥有对应股指 期货,可以进行卖空操作,通过预测两指数的收益率髙低可 以一多一空进行套利。通过WIND金融终端,获取到上证50 指数与中证500指数从2010年1月1日至2017年7月31 日的日度收盘价、日度成交量数据。将前80%的数据作为训 练集,后20%的数据作为测试集,进行预测。上证50指数和 中证500指数的价量数据分别如图3、图4所示。

采用提取原始数据特征值的方式,提高输入信息的有效性。 提取特征包括均值、方差和拟合斜率。均值表示历史所选取 时间段内的一般水平,方差表示该时间段内波动性,斜率为 该时间段内数值拟合一次函数的斜率,表示该时间段内的总 体趋势。选取前60个交易日指数价量数据预测未来20个 交易日两指数收益率相对高低,计算均值、方差和拟合斜率 进行预测准确率为59% ,用原始数据直接输入进行预测准确 率为51%。因此采用历史数据均值、方差和拟合一次函数斜 率比直接使用原始价量数据进行预测更加有效。3.2辅助预测指标

在基础指标的基础上,考虑到预测目标为判断两指数相 对收益,因此增加两指数比值作为辅助预测指标。基于股市 大小盘风格的轮动特征,大盘股或小盘股均不会表现长期持 续优于另一类,因此,当中证500指数与上证50指数比值处 于历史低位时,比值有上升的可能性,即未来中证500指数 表现优于上证50指数,小盘股优于大盘股;当中证500指数 与上证50指数比值处于高位时,有下降的可能性,即未来上 证50指数表现优于中证500指数,大盘股优于小盘股。因 此计算中证500指数与上证50指数比值,并将当前比值与 历史比值进行对比,计算历史水平指标,有助于提高预测未 来两指数相对收益的准确率。用当前比值减去历史最低值, 除以历史最高值与最低值的差,标准化为0到1区间,表示 当期市场比值所处的历史水平。

^

ratio^

max-min

(5)

选取时间段内该指标值如图5所示。

图4中证500价量数据

预测时,采用滚动预测的方式,滚动窗口为1个交易曰, 以保证数据的最大利用率。根据当前时点前N天的交易数 据计算得到神经网络输人指标,输出结果为预测未来M天 上证50指数和中证500指数收益率相对高低。若中证500 指数收益率更高,则神经网络输出结果为1,表示当前风格为 小盘股占优,可以考虑多配置小盘股或多中证500股指期 货、空上证50股指期货进行套利;若上证50指数收益率更 高,则输出为0,表示当前风格为大盘股占优,可以考虑多配 置大盘股或多上证50股指期货、空中证500股指期货进行 套利。

3.1提取价置数据特征

由于所有信息中,价量信息最为重要,且为指数未来走 势判断的最基本依据,因此主要采用股票指数的价量信息计 算输人指标。此前相关研究一般采用原始数据直接作为神 经网络的输入,但这种形式包含信息有限,信噪比过低,本文

增加该指标后,正确率稍有提升,达到62%。

进一步考虑基于此指标进行分类预测。当目前两指数 比值处于不同历史水平时,训练不同的模型,预测时根据比 值历史水平指标采用对应模型进行预测。观察训练集数据, 确定分界点分为三组:比值水平低于〇. 75为第一组,比值介 于0.75和0.8之间为第二组,比值高于0.8为第三组。进行 分组预测,效果得到显著提高,预测准确率提升到70%。3.3预测时间长度分析

原有输人数据指标不变,改变预测期的时间长度,原预

—241 —

图5

比值历史水平.5^

、分、分、分、才

测期为使用历史60日、40日、20日三个时间段交易价量信 息分别计算均值、方差、斜率指标预测未来20个交易日收益 情况,对比将预测期改为5个交易日,数据输入为5日、10 日、20日值;以及将预测期改为30个交易日,数据输入为30 日、60日、90日值,研究短期高频次的预测效果以及长期低 频次预测效果。与原定预测期为20交易日进行对比,结果 发现,将预测频率降低或升高,预测精度均有所下降,印证之 前关于风格周期长度的研究,即1个月(20个交易日)最为 明显。4

结果分析

由以上结果发现,在因子输人方面,相较于直接使用原 始价量信息,提取时间序列均值、方差、拟合斜率特征用于神 经网络预测更为有效,降低了输人数据的信噪比且减小了模 型计算量和复杂度。加人当前比值处于历史水平位置这一 指标对预测效果有一定改善,当比值处于历史最高位或最低 位时,很难长期持续,反向变动的可能性大大增加。在预测 时间段的选取方面,以20个交易日,即一个月作为预测周 期,预测效果最优,基于短期趋势会延续、长期可能发生反转 的市场规律,输人数据分别计算短期(前20个交易日)、中期 (前40个交易日)、长期(前60个交易日)指标。将以上指标 作为输人因子,且根据所处指数比值所处历史位置的不同, 分三种情况分别训练神经网络,有较好的预测效果。正确率 结果如表1所示。

表1

输入因子收盘价成交量收盘价均值收盘价方差收盘价拟合斜率成交量拟合斜率比值所处历史水平根据比值水平分组

预测准确率

51%

59%

62%

策略正确率对比策略1

策略2

策略3

策略4

5结束语

本文采用经过遗传算法优化的BP神经网络,来预测股

市大小盘风格,遗传算法具有较强的全局优化能力,神经网 络具有良好的对非线性函数的拟合能力。在此模型基础上, 采用上证50指数和中证500指数的价量信息进行仿真,提 取指标,比较不同的输人因子,对两者在未来一段时期内的 涨跌进行预测。最终发现将两指数比值所处历史水平、20 日、40日和60日价格数据的拟合斜率、均值、方差以及成交 量数据的拟合斜率作为输人因子,按照比值历史水平分为三 类分别训练和预测,有较好的效果。参考文献:

[1]

韦立坚,等.中国股票市场风格轮动效应及基于适应市场假说 的解释[J].管理学报,2012,9(7) :943.[2]

肖峻,宇熹,陈伟忠.中国股市风格动量实证研究[J].财经科

学,2006 2006(3) :23-29.

[3] Q Sun, W G Che, H L Wang. Bayesian Regularization BP Neural

Network Model for the Stock Price Prediction [ M ]. Foundations and Applications of Intelligent Systems. Springer Berlin Heidel­berg, 2014:521-531.

[4] 徐颢华,顾海峰.股指期货短期价格预测模型研究一

基于差

分BP神经网络模型[J].金融理论探索,2014,155(3):27- 32.

[5] 王唯贤,陈利军.股票价格预测的建模与仿真研究[J].计算

机仿真,2012,29(1 ):344-347.

[6] 张彤,张华,王子才.浮点数编码的遗传算法及其应用[J].哈

尔滨工业大学学报,2000,32(4) :59-61.

[7] 付晓明,王福林,尚家杰.基于多子代遗传算法优化BP神经网

络[J].计算机仿真,2016,33(3):258-263.

VV

VVV• V

VVVVV

VVVVVV

70%

[作者简介]

郭怡然(1993-),女(汉族),四川省成都市人,硕士

研究生,主要研究领域为组合投资;

王秀利(1977-),男(汉族),山东省高唐县人,副教

授,硕士研究生导师,主要研究领域为投资组合优

厂■PW、化、数据挖掘。

(上接第132页)

[14] Liu Fangrui, et al. A variable step size INC MPPT method for PV

systems[ J]. IEEE Transactions On Industrial Electronics, 2008, 55(7) :2622 -2628.

[15] 李雅梅,隋場.

[作者简介]

孟超(I993-),男(汉族),云南人,硕士研究生,

研究方向为农业电气化与自动化;

赵咪(1980-),女(汉族),人,副教授,硕士

研究生导师,主要研究方向为智能电网故障诊断与 控制等(通讯作者);

一种改进的光伏电池最大功率点跟踪控制方

法[J].电源技术,2015,39(7):1416-1418.

[16] 王立乔.分布式发电系统中的光伏发电技术[M].北京:机

械工业出版社,2014.

周伟绩(1983-),男(汉族),人,讲师,主要研究方向:新能源并

网控制等。

—242 —

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo0.cn 版权所有 湘ICP备2023017654号-2

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务