首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于指数特征提取的股指预测方法、服务器及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:平安科技(深圳)有限公司

摘要:本发明提供了一种基于指数特征提取的股指预测方法、装置及存储介质,该方法提取预设数量的时间序列中所有时间点的指数因子及对应的收益率,根据预设规则选取n个指数因子构成一个n维向量,将各个时间点的n维向量及其对应的收益率分别组成一个待训练的样本数据。之后,该方法利用样本数据中的n维向量及其对应的收益率对双向长短期记忆网络模型进行训练,确定模型参数。最后,该方法接收待分析的时间序列,提取出该时间序列所有时间点的n维向量输入到训练好的双向长短期记忆网络模型中,得到该段时间序列的综合解释性指标。利用本发明,能够深层次的提取指数的特征,提高股指预测的准确性。

主权项:1.一种基于指数特征提取的股指预测方法,应用于服务器,其特征在于,所述方法包括:样本采集步骤:提取预设数量的时间序列中所有时间点的指数因子及对应的收益率,根据预设规则选取n个指数因子构成一个n维向量xi,i0且i为整数,将各个时间点的n维向量xi及其对应的收益率组成待训练的样本数据;提取步骤:提取样本数据中每段时间序列的所有时间点的n维向量xi,作为双向长短期记忆网络模型第一层的输入;处理步骤:在双向长短期记忆网络模型的第二层,根据某段时间序列的某个时间点的n维向量xi及前一个时间点的n维向量xi-1的隐藏层状态向量hi-1计算该时间点的n维向量xi的第一隐藏层状态向量hi,并根据该时间点的n维向量xi及后一个时间点的n维向量xi+1的隐藏层状态向量hi+1计算该时间点n维向量xi的第二隐藏层状态向量hi’,将第一隐藏层状态向量hi和第二隐藏层状态向量hi’进行平均处理,得到该时间点的综合隐藏层状态向量,直至算出所有时间点的综合隐藏层状态向量,再根据每段时间序列的所有时间点的综合隐藏层状态向量得到每段时间序列的特征向量Ti;计算步骤:在双向长短期记忆网络模型的第三层,根据每段时间序列的特征向量Ti,利用预设的指标计算公式计算下一段时间序列的综合解释性指标S,所述指标计算公式为:S=a1T1+a2T2+a3T3+…+akTk其中,T1、T2、……、Tk分别代表每段时间序列的特征向量,a1、a2、……、ak分别代表T1、T2、……、Tk的权重;权重确定步骤:在双向长短期记忆网络模型的最后一层,将每段时间序列的综合解释性指标S及该段时间序列对应的所有收益率代入反向传播算法,得到各段时间序列的权重ai,所述反向传播算法的公式为: 其中,所述a′k代表更新后的第k个权重,ak代表更新前的第k个权重,η代表学习速率,0.1η3,代表整体误差E对ak的偏导值;预测步骤:接收待分析的时间序列,提取该段时间序列中所有时间点的n维向量,输入到训练好的双向长短期记忆网络模型中,得到该时间序列的综合解释性指标S。

全文数据:基于指数特征提取的股指预测方法、服务器及存储介质技术领域[0001]本发明涉及计算机技术领域,尤其涉及一种基于指数特征提取的股指预测方法、服务器及计算机可读存储介质。背景技术[0002]因子一般是指对研究事物具有影响作用的特征或因素。指数相对于其他指标而言,往往具有时序依赖的特征。目前的指数因子特征提取方法,可以是提取指数位于某一时刻的特定维度的特征,也可以是提取长时间段上指数的趋势性与周期性特征,而对于相邻时序间的依赖关系特征较难提取,从而不能够科学地衡量指数走势。发明内容[0003]鉴于以上内容,本发明提供一种基于指数特征提取的股指预测方法、服务器及计算机可读存储介质,其主要目的在于提取多重指数特征所包含的综合信息,科学、准确地预测指数走势。[0004]为实现上述目的,本发明提供一种基于指数特征提取的股指预测方法,该方法包括:[0005]样本采集步骤:提取预设数量的时间序列中所有时间点的指数因子及对应的收益率,根据预设规则选取η个指数因子构成一个η维向量Xl,i0且i为整数,将各个时间点的η维向量及其对应的收益率组成待训练的样本数据;[0006]提取步骤:提取样本数据中每段时间序列的所有时间点的η维向量X1,作为双向长短期记忆网络模型第一层的输入;[0007]处理步骤:在双向长短期记忆网络模型的第二层,根据某段时间序列的某个时间点的η维向量Xi及前一个时间点的η维向量xi-i的隐藏层状态向量hi-i计算该时间点的η维向量Xi的第一隐藏层状态向量hi,并根据该时间点的η维向量Xi及后一个时间点的η维向量xi+i的隐藏层状态向量h1+1计算该时间点η维向量的第二隐藏层状态向量lu’,将第一隐藏层状态向量Iu和第二隐藏层状态向量lu’进行平均处理,得到该时间点的综合隐藏层状态向量,直至算出所有时间点的综合隐藏层状态向量,再根据每段时间序列的所有时间点的综合隐藏层状态向量得到每段时间序列的特征向量Ti;[0008]计算步骤:在双向长短期记忆网络模型的第三层,根据每段时间序列的特征向量T1,利用预设的指标计算公式计算下一段时间序列的综合解释性指标S;[0009]权重确定步骤:在双向长短期记忆网络模型的最后一层,将每段时间序列的综合解释性指标S及该段时间序列对应的所有收益率代入反向传播算法,得到各段时间序列的权重ai;[0010]预测步骤:接收待分析的时间序列,提取该段时间序列中所有时间点的η维向量,输入到训练好的双向长短期记忆网络模型中,得到该时间序列的综合解释性指标S。[0011]优选地,所述预设规则包括:[0012]分析用户的需求,根据用户需求确定用户意图;及[0013]根据预设的意图与指数因子的对应关系,选取对应的指数因子。[00M]优选地,所述预设的指标计算公式为:[0015]S=aiTi+a2T2+a3T3+."+akTk[0016]其中,Ti、T2、......、Tk分别代表每段时间序列的特征向量,ai、a2、......、ak分别代表Τι、Τ2、……、Tk的权重。[0017]优选地,所述反向传播算法的公式为:[0018][0019]其中,所述\代表更新后的第k个权重,ak代表更新前的第k个权重,ri代表学习速率,0·1〈η〈3,代表整体误差E对ak的偏导值。[0020]优选地,该方法还包括:[0021]判断预设数量的时间序列的长度是否超过预设值,若时间序列的长度超过预设值,则以预设方式对时间序列进行截取,得到长度合适的时间序列。[0022]此外,本发明还提供一种服务器,该服务器包括:存储器、处理器及显示器,所述存储器上存储股指预测程序,所述股指预测程序被所述处理器执行,可实现如下步骤:[0023]样本采集步骤:提取预设数量的时间序列中所有时间点的指数因子及对应的收益率,根据预设规则选取η个指数因子构成一个η维向量Xl,i0且i为整数,将各个时间点的η维向量^及其对应的收益率组成待训练的样本数据;[0024]提取步骤:提取样本数据中每段时间序列的所有时间点的η维向量X1,作为双向长短期记忆网络模型第一层的输入;[0025]处理步骤:在双向长短期记忆网络模型的第二层,根据某段时间序列的某个时间点的η维向量Xi及前一个时间点的η维向量xi-i的隐藏层状态向量hi-i计算该时间点的η维向量Xi的第一隐藏层状态向量hi,并根据该时间点的η维向量Xi及后一个时间点的η维向量xi+i的隐藏层状态向量h1+1计算该时间点η维向量^的第二隐藏层状态向量lu’,将第一隐藏层状态向量Iu和第二隐藏层状态向量lu’进行平均处理,得到该时间点的综合隐藏层状态向量,直至算出所有时间点的综合隐藏层状态向量,再根据每段时间序列的所有时间点的综合隐藏层状态向量得到每段时间序列的特征向量Ti;[0026]计算步骤:在双向长短期记忆网络模型的第三层,根据每段时间序列的特征向量T1,利用预设的指标计算公式计算下一段时间序列的综合解释性指标S;[0027]权重确定步骤:在双向长短期记忆网络模型的最后一层,将每段时间序列的综合解释性指标S及该段时间序列对应的所有收益率代入反向传播算法,得到各段时间序列的权重ai;[0028]预测步骤:接收待分析的时间序列,提取该段时间序列中所有时间点的η维向量,输入到训练好的双向长短期记忆网络模型中,得到该时间序列的综合解释性指标S。[0029]优选地,所述预设规则包括:[0030]分析用户的需求,根据用户需求确定用户意图;及[0031]根据预设的意图与指数因子的对应关系,选取对应的指数因子。[0032]优选地,所述预设的指标计算公式为:[0033]S=aiTi+a2T2+a3T3+."+akTk[0034]其中,Τι、Τ2、......、Tk分别代表每段时间序列的特征向量,ai、a2、......、ak分别代表Τι、Τ2、……、Tk的权重。[0035]优选地,所述反向传播算法的公式为:[0036][0037]其中,所述\代表更新后的第k个权重,ak代表更新前的第k个权重,Tl代表学习速率,0.1〈n〈3,代表整体误差E对ak的偏导值。[0038]此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中包括股指预测程序,所述股指预测程序被处理器执行时,可实现如上所述基于指数特征提取的股指预测方法中的任意步骤。[0039]本发明提出的基于指数特征提取的股指预测方法、服务器及计算机可读存储介质,通过提取每段时间序列所有时间点的指数因子及对应的收益率,并选取η个指数因子构成η维向量Xi,接着,将η维向量xi及收益率代入双向长短期记忆网络模型中训练,得到完整的模型,最后,提取待分析的时间序列的η维向量,输入到模型中,得到该时间序列的综合解释性指标,从而减少梯度爆炸或梯度消失,准确的预测股指的走势。附图说明[0040]图1为本发明服务器较佳实施例的示意图;[0041]图2为图1中股指预测程序较佳实施例的模块示意图;[0042]图3为本发明基于指数特征提取的股指预测方法较佳实施例的流程图;[0043]图4为本发明双向长短期记忆网络模型的示意图。[0044]本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式[0045]应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。[0046]如图1所示,是本发明服务器1较佳实施例的示意图。[0047]在本实施例中,服务器1是指产品服务平台,该服务器1可以是服务器、平板电脑、个人电脑、便携计算机以及其它具有运算功能的电子设备。[0048]该服务器1包括:存储器11、处理器12及网络接口13。其中,网络接口13可选地可以包括标准的有线接口、无线接口(如WI-FI接口)。[0049]存储器11至少包括一种类型的可读存储介质。所述至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器等的非易失性存储介质。在一些实施例中,所述存储器11可以是所述服务器1的内部存储单元,例如该服务器1的硬盘。在另一些实施例中,所述存储器11也可以是所述服务器1的外部存储单元,例如所述服务器1上配备的插接式硬盘,智能存储卡(SmartMediaCard,SMC,安全数字(SecureDigital,SD卡,闪存卡FlashCard等。在本实施例中,所述存储器11不仅可以用于存储安装于所述服务器1的应用软件及各类数据,例如股指预测程序10及训练好的双向长短期记忆网络模型等。[0050]处理器12在一些实施例中可以是一中央处理器(CentralProcessingUnit,CPU,微处理器或其它数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行股指预测程序10的计算机程序代码、执行双向长短期记忆网络模型的训练等。[0051]图2仅示出了具有组件11-13以及股指预测程序10的服务器1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。[0052]可选地,该服务器1还可以包括显示器,显示器可以称为显示屏或显示单元。在一些实施例中显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管OrganicLight-EmittingDiode,0LED触摸器等。显示器用于显示在服务器1中处理的信息以及用于显示可视化的工作界面,例如显示各个任务当前的执行状态。[0053]可选地,该服务器1还可以包括用户接口,用户接口可以包括输入单元比如键盘Keyboard、语音输出装置比如音响、耳机等,可选地用户接口还可以包括标准的有线接口、无线接口。[0054]可选地,该服务器1还包括触摸传感器。所述触摸传感器所提供的供用户进行触摸操作的区域称为触控区域。此外,这里所述的触摸传感器可以为电阻式触摸传感器、电容式触摸传感器等。而且,所述触摸传感器不仅包括接触式的触摸传感器,也可包括接近式的触摸传感器等。此外,所述触摸传感器可以为单个传感器,也可以为例如阵列布置的多个传感器。用户可以通过触摸所述触控区域启动股指预测程序10。[0055]此外,该电子装置1的显示器的面积可以与所述触摸传感器的面积相同,也可以不同。可选地,将显示器与所述触摸传感器层叠设置,以形成触摸显示屏。该装置基于触摸显示屏侦测用户触发的触控操作。[0056]该服务器1还可以包括射频RadioFrequency,RF电路、传感器和音频电路等等,在此不再赘述。[0057]如图2所示,是图1中股指预测程序10较佳实施例的模块示意图。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。[0058]在本实施例中,股指预测程序10包括:样本采集模块110、提取模块120、处理模块130、计算模块140、权重确定模块150及预测模块160,结合图3中程序模块的应用环境示意图,所述模块110-160所实现的功能或操作步骤如下:[0059]样本采集模块110,用于从数据平台,如金融数据和分析工具服务商Wind、彭博Bloomberg等,提取沪深300指数2个月内每段时间序列所有时间点的指数因子及对应的收益率,并根据预设规则选取η个指数因子映射成一个η维向量Xl,i〇且i为整数。其中,解释沪深300指数的常见指数因子有以下13种,包括:中债国债到期收益率:10年-中债企业债至IJ期收益率AAA:10年、风险溢价、股息率、慢速KD指标SlowKD、平滑异同移动平均线直方图(MovingAverageConvergenceandDivergenceHistogram,MACDHistogram、布林线指标(BollingerBands、移动平均线-相对强弱指标MAofRSI14[m=22]54-periodMAof4weekMAofmodifiedOBV-MA4*4、CR指标、大小盘换手率比值、RSRS指标、溢价率、主动买入额。所述预设规则包括:分析用户的需求,根据用户需求确定用户意图,并根据预设的意图与指数因子的对应关系,选取对应的指数因子。所述用户意图是指用户希望综合指标所反映的结果,包括希望综合指标所反映的结果是时间序列的指数走势或时间点的具体的收益率。所述收益率是指日收益率,即以一天为时间间隔的相对收益。所述日收益率的计算公式为:第η日的收益率=第n+1日收盘价-第η日收盘价第η日收盘价。[0060]进一步地,在指数因子特征提取前,还需要先判断每段时间序列的长度是否超过预设值,若时间序列的长度超过预设值,则以预设方式对时间序列进行截取,得到长度合适的时间序列。所述预设方式可以是指以步长为tt=2,3,……)进行截取数据。假设,预设值为30,对于长度超过30个时间单位的时间序列,可能会造成梯度爆炸或梯度消失,待分析的时间序列为50个时间单位,采用步长为2的采样方法对序列进行重构,将时间序列长度归为25个时间单位。[0061]提取模块120,用于提取样本数据中每段时间序列所有时间点的η维向量X1,作为双向长短期记忆网络模型第一层的输入。例如,提取样本数据中每段时间序列的每日的η个指数因子及对应的收益率,根据η个指数因子构成η维向量,将η维向量和对应的收益率进行数据划分为训练集及验证集,将训练集中是η维向量输入到双向长短期记忆网络进行训练。[0062]处理模块130,用于在双向长短期记忆网络模型的第二层,根据某段时间序列的某个时间点的η维向量Xi及前一个时间点的η维向量xi-i的隐藏层状态向量hi-i计算该时间点的η维向量Xi的第一隐藏层状态向量hi,并根据该时间点的η维向量Xi及后一个时间点的η维向量xi+i的隐藏层状态向量hi+i计算该时间点η维向量Xi的第二隐藏层状态向量hi’,将第一隐藏层状态向量Iu和第二隐藏层状态向量W进行平均处理,得到该段时间序列中每个时间点η维向量的综合隐藏层状态向量。以此类推,算出时间段上所有时间点的综合隐藏层状态向量,再根据每段时间序列的所有时间点的综合隐藏层状态向量得到每段时间序列的特征向量Ti。[0063]在另一个实施例中,还可以将该段时间序列中每个时间点η维向量的第一隐藏层状态向量Iu和第二隐藏层状态向量W进行拼接处理,得到每个时间点η维向量的综合隐藏层状态向量T1。例如,将4月份每一日的η维向量的第一隐藏层状态向量Iu和第二隐藏层状态向量W进行拼接处理,得到每一日的综合隐藏层状态向量。[0064]计算模块140,用于在双向长短期记忆网络模型的第三层,根据每段时间序列的每个时间点的η维向量的综合隐藏层状态向量!^,利用预设的指标计算公式计算每段时间序列的综合解释性指标S。其中,所述预设的指标计算公式为:S=aiTi+a2T2+a3T3+"_+akTk,其中,Τι、Τ2、......、Tk分别代表每个时间点η维向量的综合隐藏层状态向量,ai、a2、......、ak分别代表……、Tk的权重。[0065]权重确定模块150,用于在双向长短期记忆网络模型的最后一层,将每段时间序列的综合解释性指标S及该段时间序列对应的所有收益率代入反向传播BackPropagation,BP算法,得到各个权重1。例如,根据沪深300指数各个月份的综合解释性指标S及每日的收益率,利用BP算法确定各个权重ai。其中,所述BP算法的表达式为:[0066][0067]其中,所述\代表更新后的第k个权重,ak代表更新前的第k个权重,Tl代表学习速率,0.1〈n〈3,代表整体误差E对¾的偏导值。具体地,整体误差E=S-Sr2,S代表综合解释性指标预测值,即上述指标计算公式计算得到的综合解释性指标,S'代表综合解释性指标的真实值,即由每日的收益率得到的综合解释性指标。进一步地,当输出的综合解释性指标为2维,即综合解释性指标为SjPS2时,E=0.5Si-Syi+O』S2-S^I对E求ak的偏导乘以学习速率,得到偏置值,ak减去偏置值得到ak的更新值a、。持续循环训练,直到偏置值)达到预设值,模型为最优模型,输出最终的各个权重值。[0068]预测模块160,用于接收待分析的时间序列,提取出时间序列中所有时间点的η维向量,输入到训练好的双向长短期记忆网络模型中,得到该时间序列的综合解释性指标。例如,需要解释2018年5月指数走势时,可以选取前几个月的逐日数据,提取每日的η维向量,输入到训练好的双向长短期记忆网络模型中,得到该5月的指数走势。[0069]如图3所示,是本发明基于指数特征提取的股指预测方法较佳实施例的流程图。[0070]下面以沪深300指数为例,但不仅限于沪深300指数,对本发明加以阐述。在本实施例中,处理器12执行存储器11中存储的股指预测程序10的计算机程序时实现基于指数特征提取的股指预测方法包括:步骤SlO-步骤S60,其中,步骤SlO为样本数据的采集步骤,步骤S20-50为双向长短期记忆网络模型的训练步骤,如图4所示,是本发明双向长短期记忆网络模型的示意图,步骤S60为股指趋势的预测步骤。[0071]步骤S10,样本采集模块110从数据平台,如金融数据和分析工具服务商Wind、彭博Bloomberg等,提取沪深300指数2个月内每段时间序列所有时间点的指数因子及对应的收益率,并根据预设规则选取η个指数因子映射成一个η维向量Xl,i〇且i为整数。其中,解释沪深300指数的常见指数因子有以下13种,包括:中债国债到期收益率:10年-中债企业债到期收益率AAA:10年、风险溢价、股息率、慢速KD指标SlowKD、平滑异同移动平均线直方图MovingAverageConvergenceandDivergenceHistogram,MACDHistogram、布林线指标BollingerBands、移动平均线-相对强弱指标MAofRSI14[m=22]54-periodMAof4weekMAofmodifiedOBV-MA4*4、CR指标、大小盘换手率比值、RSRS指标、溢价率、主动买入额。所述预设规则包括:分析用户的需求,根据用户需求确定用户意图,并根据预设的意图与指数因子的对应关系,选取对应的指数因子。所述用户意图是指用户希望综合指标所反映的结果,包括希望综合指标所反映的结果是时间序列的指数走势或时间点的具体的收益率。例如,当用户希望从宏观基本角度对沪深300走势进行刻画时,可以选取专注于宏观基本角度的5个指数因子,包括:中债国债到期收益率:10年-中债企业债到期收益率AAA:10年、风险溢价、股息率、溢价率及主动买入额,构成一个5维的向量。将各个时间点的η维向量X1及其对应的收益率组成待训练的样本数据。所述收益率是指日收益率,即以一天为时间间隔的相对收益。所述日收益率的计算公式为:第η日的收益率=第η+1日收盘价-第η日收盘价第η日收盘价。[0072]进一步地,在指数因子特征提取前,还需要先判断每段时间序列的长度是否超过预设值,若时间序列的长度超过预设值,则以预设方式对时间序列进行截取,得到长度合适的时间序列。所述预设方式可以是指以步长为tt=2,3,……)进行截取数据。假设,预设值为30,对于长度超过30个时间单位,如30天,的时间序列,可能会造成梯度爆炸或梯度消失,待分析的时间序列为50个时间单位,采用步长为2的采样方法对序列进行重构,将时间序列长度归为25个时间单位。[0073]步骤S20,提取模块120提取样本数据中每段时间序列所有时间点的η维向量X1,作为双向长短期记忆网络模型第一层的输入。例如,提取样本数据中每段时间序列的每日的η个指数因子及对应的收益率,根据η个指数因子构成η维向量,将η维向量和对应的收益率进行数据划分为训练集及验证集,将训练集中是η维向量输入到双向长短期记忆网络进行训练。[0074]步骤S30,在双向长短期记忆网络模型的第二层,处理模块130根据某段时间序列的某个时间点的η维向量Xi及前一个时间点的η维向量xi-i的隐藏层状态向量hi-i计算该时间点的η维向量Xi的第一隐藏层状态向量hi,并根据该时间点的η维向量Xi及后一个时间点的η维向量xi+i的隐藏层状态向量hi+i计算该时间点η维向量Xi的第二隐藏层状态向量hi’,将第一隐藏层状态向量Iu和第二隐藏层状态向量W进行平均处理,得到该段时间序列中每个时间点η维向量的综合隐藏层状态向量。以此类推,算出时间段上所有时间点的综合隐藏层状态向量,再根据每段时间序列的所有时间点的综合隐藏层状态向量得到每段时间序列的特征向量!^。例如,根据沪深300指数4月15日的η维向量χθΡ4月14日的η维向量Xe的隐藏层状态向量he计算15日的η维向量^的第一隐藏层状态向量lu,并根据沪深300指数4月15日的η维向量Xi和4月16日的η维向量xi-i的隐藏层状态向量hi+i计算该日的η维向量Xi的第二隐藏层状态向量lu’,将4月15日的第一隐藏层状态向量Iu和第二隐藏层状态向量lu’进行平均处理,得到4月15日的综合隐藏层状态向量。以此类推,算出时序中所有时间点的综合隐藏层状态向量,得到4月份的特征向量Ti。[0075]在另一个实施例中,还可以将该段时间序列中每个时间点η维向量的第一隐藏层状态向量Iu和第二隐藏层状态向量W进行拼接处理,得到每个时间点η维向量的综合隐藏层状态向量T1。例如,将4月份每一日的η维向量的第一隐藏层状态向量Iu和第二隐藏层状态向量W进行拼接处理,得到每一日的综合隐藏层状态向量。[0076]步骤S40,在双向长短期记忆网络模型的第三层,计算模块140根据每段时间序列的特征向量T1,利用预设的指标计算公式计算下一段时间序列的综合解释性指标S。其中,所述预设的指标计算公式为:S=aiTi+a2T2+a3T3+"_+akTk,其中,Τι、Τ2、......、Tk分别代表每个时间点η维向量的综合隐藏层状态向量,ai、a2、......、ak分别代表Ti、T2、......、Tk的权重。例如,将1-4月份的特征向量T1-T4输入预设的指标计算公式,得到5月份的综合解释性指标S。[0077]步骤S50,在双向长短期记忆网络模型的最后一层,权重确定模块150将每段时间序列的综合解释性指标S及该段时间序列对应的所有收益率代入BP算法,得到各个权重ai。例如,根据沪深300指数各个月份的综合解释性指标S及每日的收益率,利用BP算法确定各个权重。其中,所述BP算法的表达式为:[0078][0079]其中,所述\代表更新后的第k个权重,ak代表更新前的第k个权重,Tl代表学习速率,0.1〈n〈3,·代表整体误差E对ak的偏导值。具体地,整体误差E=S-Sr2,S代表综合解释性指标预测值,即上述指标计算公式计算得到的综合解释性指标,S'代表综合解释性指标的真实值,即由每日的收益率得到的综合解释性指标。进一步地,当输出的综合解释性指标为2维,即综合解释性指标为SjPS2时,E=0.5Si-Syi+O』S2-S^I对E求ak的偏导乘以学习速率,得到偏置值,ak减去偏置值得到ak的更新值a、。持续循环训练,直到偏置值达到预设值,模型为最优模型,输出最终的各个权重值。[0080]步骤S60,预测模块160接收待分析的时间序列,提取出时间序列中所有时间点的η维向量,输入到训练好的双向长短期记忆网络模型中,得到该时间序列的综合解释性指标。例如,需要解释2018年5月指数走势时,可以选取前几个月的逐日数据,提取每日的η维向量,输入到训练好的双向长短期记忆网络模型中,得到该5月的指数走势。[0081]上述实施例提出的基于指数特征提取的股指预测方法,通过提取每段时间序列所有时间点的指数因子及对应的收益率,并选取η个指数因子构成η维向量Xi。之后,该方法将η维向量xi及收益率代入双向长短期记忆网络模型中训练,得到完整的模型。最后,该方法提取待分析的时间序列的η维向量,输入到模型中,得到该时间序列的综合解释性指标,从而避免梯度消失和梯度爆炸,准确的分析股指的走势。[0082]此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质中包括股指预测程序10,所述股指预测程序10被处理器执行时实现如下操作:[0083]样本采集步骤:提取预设数量的时间序列中所有时间点的指数因子及对应的收益率,根据预设规则选取η个指数因子构成一个η维向量Xl,i0且i为整数,将各个时间点的η维向量^及其对应的收益率组成待训练的样本数据;[0084]提取步骤:提取样本数据中每段时间序列的所有时间点的η维向量X1,作为双向长短期记忆网络模型第一层的输入;[0085]处理步骤:在双向长短期记忆网络模型的第二层,根据某段时间序列的某个时间点的η维向量Xi及前一个时间点的η维向量xi-i的隐藏层状态向量hi-i计算该时间点的η维向量Xi的第一隐藏层状态向量hi,并根据该时间点的η维向量Xi及后一个时间点的η维向量xi+i的隐藏层状态向量h1+1计算该时间点η维向量^的第二隐藏层状态向量lu’,将第一隐藏层状态向量Iu和第二隐藏层状态向量lu’进行平均处理,得到该时间点的综合隐藏层状态向量,直至算出所有时间点的综合隐藏层状态向量,再根据每段时间序列的所有时间点的综合隐藏层状态向量得到每段时间序列的特征向量Ti;[0086]计算步骤:在双向长短期记忆网络模型的第三层,根据每段时间序列的特征向量T1,利用预设的指标计算公式计算下一段时间序列的综合解释性指标S;[0087]权重确定步骤:在双向长短期记忆网络模型的最后一层,将每段时间序列的综合解释性指标S及该段时间序列对应的所有收益率代入反向传播算法,得到各段时间序列的权重ai;[0088]预测步骤:接收待分析的时间序列,提取该段时间序列中所有时间点的η维向量,输入到训练好的双向长短期记忆网络模型中,得到该时间序列的综合解释性指标S’。[0089]优选地,所述预设规则包括:[0090]分析用户的需求,根据用户需求确定用户意图;及[0091]根据预设的意图与指数因子的对应关系,选取对应的指数因子。[0092]优选地,所述预设的指标计算公式为:[0093]S=aiTi+a2T2+a3T3+."+akTk[0094]其中,Τι、Τ2、......、Tk分别代表每段时间序列的特征向量,ai、a2、......、ak分别代表Τι、Τ2、……、Tk的权重。[0095]优选地,所述反向传播算法的公式为:[0096][0097]其中,所述\代表更新后的第k个权重,ak代表更新前的第k个权重,Tl代表学习速率,0.l〈n〈3,代表整体误差E对ak的偏导值。[0098]优选地,该方法还包括:[0099]判断预设数量的时间序列的长度是否超过预设值,若时间序列的长度超过预设值,则以预设方式对时间序列进行截取,得到长度合适的时间序列。[0100]本发明之计算机可读存储介质的具体实施方式与上述基于指数特征提取的股指预测方法的具体实施方式大致相同,在此不再赘述。[0101]上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。[0102]需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。[0103]通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如R0MRAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备可以是手机,计算机,服务器,或者网络设备等执行本发明各个实施例所述的方法。[0104]以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

权利要求:1.一种基于指数特征提取的股指预测方法,应用于服务器,其特征在于,所述方法包括:样本采集步骤:提取预设数量的时间序列中所有时间点的指数因子及对应的收益率,根据预设规则选取η个指数因子构成一个η维向量Xl,i0且i为整数,将各个时间点的η维向量以及其对应的收益率组成待训练的样本数据;提取步骤:提取样本数据中每段时间序列的所有时间点的η维向量X1,作为双向长短期记忆网络模型第一层的输入;处理步骤:在双向长短期记忆网络模型的第二层,根据某段时间序列的某个时间点的η维向量Xi及前一个时间点的η维向量xi-i的隐藏层状态向量hi-i计算该时间点的η维向量Xi的第一隐藏层状态向量lu,并根据该时间点的η维向量h及后一个时间点的η维向量χ1+1的隐藏层状态向量hi+i计算该时间点η维向量Xi的第二隐藏层状态向量hi’,将第一隐藏层状态向量Iu和第二隐藏层状态向量W进行平均处理,得到该时间点的综合隐藏层状态向量,直至算出所有时间点的综合隐藏层状态向量,再根据每段时间序列的所有时间点的综合隐藏层状态向量得到每段时间序列的特征向量Ti;计算步骤:在双向长短期记忆网络模型的第三层,根据每段时间序列的特征向量T1,利用预设的指标计算公式计算下一段时间序列的综合解释性指标S;权重确定步骤:在双向长短期记忆网络模型的最后一层,将每段时间序列的综合解释性指标S及该段时间序列对应的所有收益率代入反向传播算法,得到各段时间序列的权重Bi;预测步骤:接收待分析的时间序列,提取该段时间序列中所有时间点的η维向量,输入到训练好的双向长短期记忆网络模型中,得到该时间序列的综合解释性指标S。2.根据权利要求1所述的基于指数特征提取的股指预测方法,其特征在于,所述预设规则包括:分析用户的需求,根据用户需求确定用户意图;及根据预设的意图与指数因子的对应关系,选取对应的指数因子。3.根据权利要求1所述的基于指数特征提取的股指预测方法,其特征在于,所述预设的指标计算公式为:其中,Τι、Τ2、......、Tk分别代表每段时间序列的特征向量,ai、a2、......、ak分别代表Τι、T2、……、Tk的权重。4.根据权利要求1或3所述的基于指数特征提取的股指预测方法,其特征在于,所述反向传播算法的公式为:其中,所述\代表更新后的第k个权重,ak代表更新前的第k个权重,Tl代表学习速率,〇.10且i为整数,将各个时间点的η维向量以及其对应的收益率组成待训练的样本数据;提取步骤:提取样本数据中每段时间序列的所有时间点的η维向量X1,作为双向长短期记忆网络模型第一层的输入;处理步骤:在双向长短期记忆网络模型的第二层,根据某段时间序列的某个时间点的η维向量Xi及前一个时间点的η维向量xi-i的隐藏层状态向量hi-i计算该时间点的η维向量Xi的第一隐藏层状态向量lu,并根据该时间点的η维向量h及后一个时间点的η维向量χ1+1的隐藏层状态向量hi+i计算该时间点η维向量Xi的第二隐藏层状态向量hi’,将第一隐藏层状态向量Iu和第二隐藏层状态向量W进行平均处理,得到该时间点的综合隐藏层状态向量,直至算出所有时间点的综合隐藏层状态向量,再根据每段时间序列的所有时间点的综合隐藏层状态向量得到每段时间序列的特征向量Ti;计算步骤:在双向长短期记忆网络模型的第三层,根据每段时间序列的特征向量T1,利用预设的指标计算公式计算下一段时间序列的综合解释性指标S;权重确定步骤:在双向长短期记忆网络模型的最后一层,将每段时间序列的综合解释性指标S及该段时间序列对应的所有收益率代入反向传播算法,得到各段时间序列的权重Bi;预测步骤:接收待分析的时间序列,提取该段时间序列中所有时间点的η维向量,输入到训练好的双向长短期记忆网络模型中,得到该时间序列的综合解释性指标S。7.根据权利要求6所述的服务器,其特征在于,所述预设规则包括:分析用户的需求,根据用户需求确定用户意图;及根据预设的意图与指数因子的对应关系,选取对应的指数因子。8.根据权利要求6所述的服务器,其特征在于,所述预设的指标计算公式为:S=aiTi+a2T2+a3T3+··-+akTk其中,Τι、Τ2、......、Tk分别代表每段时间序列的特征向量,ai、a2、、ak分别代表Τι、T2、……、Tk的权重。9.根据权利要求6或8所述的服务器,其特征在于,所述反向传播算法的公式为:其中,所述\代表更新后的第k个权重,ak代表更新前的第k个权重,ri代表学习速率,〇.1η3;代表整体误差E对ak的偏导值。10.—种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括股指预测程序,所述股指预测程序被处理器执行时,可实现如权利要求1至5中任一项所述基于指数特征提取的股指预测方法的步骤。

百度查询: 平安科技(深圳)有限公司 基于指数特征提取的股指预测方法、服务器及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。