首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

算法交易系统及基于该系统的算法交易模型的训练方法 

申请/专利权人:南京大学

申请日:2021-04-28

公开(公告)日:2024-06-25

公开(公告)号:CN113283986B

主分类号:G06Q40/04

分类号:G06Q40/04;G06N3/0442

优先权:

专利状态码:有效-授权

法律状态:2024.06.25#授权;2021.09.07#实质审查的生效;2021.08.20#公开

摘要:本申请公开了一种基于自注意力机制的算法交易系统及基于该系统的算法交易模型的训练方法。其中系统包括:全连接神经网络模块,用于对输入的交易数据进行特征提取、转换和映射;自注意力机制模块,用于衡量不同时刻特征不同的重要程度,并提取其中较为重要的有效信息;长短时记忆网络模块,用于根据自注意力机制模块处理后的序列化信息输出交易决策。本申请训练方法包括使用近端策略优化算法训练一个策略函数π和一个值函数V,其参数分别为θ和。本申请的有益之处在于提供了一种结合了近端策略优化算法和长短时记忆网络的优势从而实现深层次挖掘市场特征的基于自注意力机制的算法交易系统及基于该系统的算法交易模型的训练方法。

主权项:1.一种基于自注意力机制的算法交易系统,其特征在于:所述基于自注意力机制的算法交易系统包括:全连接神经网络模块,用于对输入的交易数据进行特征提取、转换和映射;自注意力机制模块,根据全连接神经网络模块输入的序列化信息,计算出代表注意力的权重向量,用于衡量不同时刻特征不同的重要程度,并提取其中较为重要的有效信息;长短时记忆网络模块,用于根据自注意力机制模块处理后的序列化信息输出交易决策;所述自注意力机制模块分别与所述全连接神经网络模块和长短时记忆网络模块构成数据连接;所述自注意力机制模块包括:查询矩阵,用于将所述全连接神经网络模块输出的特征映射为查询向量;所述自注意力机制模块包括:键矩阵,用于将所述全连接神经网络模块输出的特征映射为键向量;所述自注意力机制模块包括:值矩阵,用于将所述全连接神经网络模块输出的特征映射为值向量;所述长短时记忆网络模块以所述自注意力机制模块输出作为输入从而捕捉输入数据中包含的时序关系,所述长短时记忆网络模块根据输入和自身的隐状态计算出当前时刻对应的输出并形成最后的交易动作;训练方法包括:使用近端策略优化算法训练一个策略函数π和一个值函数V,其参数分别为θ和φ;其具体方法包括如下步骤:S1初始化算法交易模型;S2根据一个设定时间段内的交易信息计算出当前时刻对应的状态信息St,所述St应当包含当前股票市场的价量信息、订单簿信息、交易信息以及相关技术指标信息;S3将St输入所述算法交易模型,在经过所述算法交易模型处理后,得到输出动作At;S4根据所述输出动作At在当前时刻交易环境中的执行结果,计算对应所述输出动作At的奖励值Rt;S5将当前的状态信息St、输出动作At和奖励值Rt作为坐标点(St,At,Rt)加入轨迹τ,如果τ的长度达到预定长度,则转至步骤S6,否则,则转至步骤S2进行下一个时刻的交易计算;S6基于当前的值函数Vφ,使用广义优势函数估计方法计算当前策略的优势,并更新策略π的参数θ;S7使用梯度下降算法最小化均方误差以更新值函数V的参数φ;重复进行步骤S2至S7直至达到指定训练步数或者直至算法交易模型收敛;所述初始化算法交易模型的步骤包括:初始化算法交易模型所包含的参数和所述长短时记忆网络模块中的人工神经网络的隐状态及交易环境;所述状态信息St的维度为D×T,T指时间段长度,D指每个时刻的输入数据维度;将St输入算法交易模型,在经过全连接神经网络模块后,得到输出St’,其维度为D’×T,T指时间段长度,D’指映射后的维度,为24。

全文数据:

权利要求:

百度查询: 南京大学 算法交易系统及基于该系统的算法交易模型的训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。