首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种交互式数据预测方法和系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广东省信息网络有限公司

摘要:本发明公开了一种交互式数据预测方法和系统,通过根据用户数据进行聚类分析生成若干个聚类簇并针对每个聚类簇建立第三数据的时序预测系统,计算预测数据漂移程度并通过向用户请求数据更新来修正聚类簇对应的时序预测系统,从而可更精确地预测区域范围内的物料需求以及波动,从而更精确地调整计划库存量。本发明作为一种交互式数据预测方法和系统可广泛应用于大数据处理领域。

主权项:1.一种交互式数据预测方法,其特征在于,包括以下步骤:A、获取当前数据库中用户数据,所述用户数据包括用于表征用户属性的第一数据、用于表征非用户属性的第二数据以及用于表征物料磨损的第三数据;B、根据用户数据进行聚类分析,生成若干个聚类簇;C、针对每个聚类簇建立第三数据的时序预测系统;D、获取最新时间的用户数据;E、根据最新时间的第三数据计算每个聚类簇对应的时序预测系统的预测数据漂移程度;F、确定预测数据漂移程度大于设定阈值时,修正聚类簇对应的时序预测系统,具体包括:向对应聚类簇的用户发送数据更新请求,并基于用户返回的数据重新执行步骤C和E;G、基于聚类簇对应的修正后的时序预测系统计算预设时间的第三数据;H、基于第三数据预测物料价格并调整预设时间的计划库存量;其中,所述步骤C具体为:获取任一聚类簇中的训练数据集,所述训练数据集特征向量只有一维,所述特征向量的特征变量为时间;为所述特征变量选择切分点Si,所述切分点Si为所述训练数据集中两个相邻数据特征变量的平均值,计算所述切分点Si两侧区间的平方误差和,并将使所述平方误差和最小的切分点作为第一最优切分点,使平方误差和最小的计算公式为: 其中:N1为最小特征变量值至切分点之间的所述训练数据数量,N2为切分点至最大特征变量值之间的所述训练数据数量,所述切分点两侧区间指所述切分点与所述最小特征变量值和最大特征变量值之间的数据;基于所述第一最优切分点,在所述最小特征变量值与所述第一最优切分点之间继续调用使平方误差和最小的计算公式,得到在最小特征变量值与所述第一最优切分点之间的第二最优切分点;在所述最大特征变量值与所述第一最优切分点之间继续调用使平方误差和最小的计算公式,得到在最大特征变量值与所述第一最优切分点之间的第三最优切分点;依次不断迭代使平方误差和最小的计算公式,计算得到第N切分点之间区间的第N最优切分点,直到相邻切分点之间的数据数量为3个;依据所述最优切分点计算各自的值,得到回归树,并依据所述特征变量在所述回归树中的取值作为时序预测系统的输出值,所述回归树为: 其中,SN1为N个最优切分点由小到大排列中最小的最优切分点,SNn为N个最优切分点由小到大排列中最大的最优切分点;其中,所述预测数据漂移程度或,所述预测数据漂移程度其中M为时序预测系统中测试集的用户个数,ru为用户u实际的第三数据,pu为用户u在训练集上的预测结果。

全文数据:

权利要求:

百度查询: 广东省信息网络有限公司 一种交互式数据预测方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。