首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

机器学习训练数据调度方法及设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:贝格迈思(深圳)技术有限公司

摘要:本申请提供机器学习训练数据调度方法及设备,其中方法包括:当目标机器学习算法启动训练时,获取目标机器学习算法对应的嫁接模块,并通过嫁接模块触发通用模块层启动;根据通用模块层中的有向无环图确定目标磁盘文件;根据目标磁盘文件到嫁接模块的所有有向路径中的适配模块构成机器学习训练模块子图;基于机器学习训练模块子图将目标磁盘文件里的原始训练数据转换为目标机器学习算法所需的数据。该技术方案可提高机器学习算法的训练数据转换效率。

主权项:1.一种机器学习训练数据调度方法,其特征在于,应用于计算机设备,所述方法包括:当目标机器学习算法启动训练时,获取所述目标机器学习算法对应的嫁接模块,并通过所述嫁接模块触发通用模块层启动,所述通用模块层是提前预设的用于机器学习算法训练数据转换的虚拟模块层,由适配模块作为节点构成;所述适配模块用于传递数据对象,所述数据对象包括磁盘文件、文件指针、内存数据中的任意一种或多种;所述适配模块包括数据视图生成模块、数据视图列变换模块、数据视图行变换模块、数据视图分批处理模块中的任意一种或多种类型;所述数据视图生成模块输入的数据对象为磁盘文件,输出的数据对象为顺序访问所述磁盘文件的文件指针;所述数据视图列变换模块包括在数据视图中添加列、删除列和改变列值的功能模块;所述数据视图列变换模块输入的数据对象为文件指针,输出的数据对象为文件指针;所述数据视图行变换模块包括在数据视图中随机采样行、以指定条件过滤行、过滤重复行和有序合并多个数据视图中数据行的功能模块;所述数据视图行变换模块输入的数据对象为磁盘文件、文件指针、内存数据中的任意一种或多种,输出的数据对象为磁盘文件、文件指针、内存数据中的任意一种或多种;所述数据视图分批处理模块包括固定行个数的分批处理和固定序列个数的分批处理模块,所述固定序列是指具有相同ID的数据行集合;所述数据视图分批处理模块输入的数据对象为文件指针,输出的数据对象为分批次的内存数据,所述分批次的内存数据供内部过程使用,所述内部过程由所述目标机器学习算法发起;根据所述通用模块层中的有向无环图确定目标磁盘文件;根据所述目标磁盘文件到所述嫁接模块的所有有向路径中的所述适配模块构成机器学习训练模块子图;基于所述机器学习训练模块子图将所述目标磁盘文件里的原始训练数据转换为所述目标机器学习算法所需的数据。

全文数据:

权利要求:

百度查询: 贝格迈思(深圳)技术有限公司 机器学习训练数据调度方法及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术