【发明公布】一种基于Pytorch框架的数据并行优化方法_电子科技大学_202310750946.9

导航：龙图腾网> 最新专利技术> 一种基于Pytorch框架的数据并行优化方法_电子科技大学_202310750946.9

申请/专利权人：电子科技大学

申请日：2023-06-25

公开（公告）日：2023-07-28

公开（公告）号：CN116501502A

主分类号：G06F9/50

分类号：G06F9/50;G06N3/098

优先权：

专利状态码：有效-授权

法律状态：2023.09.05#授权;2023.08.15#实质审查的生效;2023.07.28#公开

摘要：本发明公开了一种基于Pytorch框架的数据并行优化方法，属于计算机技术领域，具体为：加载模型阶段；按照前一轮训练后各节点之间的性能比例，将对应份的数据划分并加载至对应节点中；各节点将加载的数据按照当前轮批大小，对待训练模型进行当前轮训练；第一轮训练中的批大小为总批大小与节点数的比值，第二轮训练中的批大小根据第一轮训练后的性能比例分配总批大小，第三轮及之后的训练中根据前一轮训练所占用的时间计算时间波动率，若大于波动率阀值，根据第一轮训练后的性能比例分配总批大小；否则，采用前一轮训练的批大小。本发明可及时应对集群性能波动，同时避免由于节点性能微小波动而频繁调整批大小，进而带来的额外性能损耗。

主权项：1.一种基于Pytorch框架的数据并行优化方法，其特征在于，包括以下步骤：步骤1、加载模型阶段：将基于Pytorch框架编写的待训练模型加载至J个节点中，J个节点的初始性能相同；并设置训练参数，包括：初始数据集的等分数量N，总批大小b，波动率阀值T，显存阈值S，以及显存调整步进P；步骤2、加载数据阶段：在对待训练模型进行当前轮训练前，按照前一轮训练后J个节点之间的性能比例，将对应份的数据划分为J个数据集分区，并行加载至对应节点中；其中，各节点的性能高低与被划分的数据量正相关；对第一轮训练，按照J个节点之间的初始性能比例，将对应份的数据划分为J个数据集分区；步骤3、各节点将加载的数据按照当前轮的批大小，对待训练模型进行当前轮训练，包括前向传播阶段、损失计算阶段、反向传播阶段和模型参数更新阶段，获得各节点在当前轮训练过程中所占用的时间；其中，在第一轮的训练过程中，以总批大小b与节点数J的比值为当前轮的批大小；在第二轮的训练过程中，先计算各节点在第一轮训练后的性能，按照J个节点之间的性能比例，基于总批大小b重新分配当前轮训练所需的各节点的批大小；在第三轮及之后的训练过程中，先根据各节点在前一轮训练过程中所占用的时间，计算前一轮的时间波动率，若大于波动率阀值T，则计算各节点在前一轮训练后的性能，再按照J个节点之间的性能比例，基于总批大小b重新分配当前轮训练所需的各节点的批大小，各节点的性能高低与被分配的批大小正相关；否则，将前一轮训练采用的批大小作为当前轮训练所需的批大小；并且，在第二轮及之后的训练过程中，还包括对各节点所需显存大小的调节过程，具体为：根据Pytorch框架运行所需显存大小以及待训练模型在训练过程中所占用显存大小，计算各节点所需的显存大小，对显存大小大于显存阈值S的节点，将前一轮训练后与前两轮训练后之间的性能增加量减少P%，并将所减少的P%按照性能比例分配至其他节点，得到各节点在前一轮训练后的新性能，根据各节点之间的新性能比例，再次基于总批大小b重新分配当前轮训练所需的各节点的批大小；重新进行对各节点所需显存大小的调节过程，直至各节点的显存大小不超过显存阈值S；步骤4、重复执行步骤2~3，直至加载第N份数据，并完成第N轮训练。

全文数据：

权利要求：

百度查询：电子科技大学一种基于Pytorch框架的数据并行优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种辅助头部手术定位设备及其定位系统_山西嗨探科科技有限公司_202410442801.7

下一篇：一种云基础设施下的分布式金融数据管理方法及系统_深圳市今古科技有限公司_202410658501.2

相关技术

一种辅助头部手术定位设备及其定位系统_山西嗨探科科技有限公司_202410442801.7

一种云基础设施下的分布式金融数据管理方法及系统_深圳市今古科技有限公司_202410658501.2

一种自适应外肋骨大型筒体施工作业平台_武昌船舶重工集团有限公司_202410542055.9

智能应急宠物牵引绳_易植_202410574000.6

一种磁悬浮车用液压悬挂横向减振系统及其控制方法_中车青岛四方车辆研究所有限公司_202410325707.3

触控显示面板、触控显示面板的制备方法和触控显示装置_京东方科技集团股份有限公司_202410338338.1

一种超氧治疗静脉曲张输液装置及其使用方法_三河通济医院_202410416653.1

一种用于航班机组的占座方法、系统、设备及存储介质_中国民航信息网络股份有限公司_202410487321.2

钢丝绳电动葫芦_江苏鼎力重工集团有限公司_202410519274.5

铸铁孕育剂和生产铸铁孕育剂的方法_埃尔凯姆公司_202410341971.6

一种山茱萸多糖-壳聚糖复合膜及其制备方法_河南喜食散生物科技有限公司_202410331541.6

基于强化学习的图像检索方法_华东师范大学_202410347637.1

数据相关技术

一种数据建模用数据展示设备_保定科海自动化科技有限公司_202323290483.7

实时数据获取和记录数据共享系统_外托尼克斯有限公司_201980045424.0

数据处理设备、数据处理方法和程序_富士通株式会社_202311218461.1

基于数据中台的数据安全传输方法_杭州电力设备制造有限公司_202410224192.8

数据采集传输仪_宁夏华鑫融通科技有限公司_202322984643.1

数据压缩方法_瑞昱半导体股份有限公司_202211657521.5

数据加密认证方法_西交网络空间安全研究院_202410196685.5

空中(OTA)数据聚合_高通股份有限公司_202280076052.X

数据处理装置、数据处理方法、数据处理程序、终端装置和数据处理系统_索尼集团公司_201980088304.9

色谱图的数据处理方法、数据处理装置、色谱装置、数据处理程序以及记录介质_日本株式会社日立高新技术科学_202311406804.7

并行相关技术

基于动态策略的用户请求并行化_谷歌有限责任公司_202280078807.X

稀疏稠密矩阵数据的并行处理方法与系统_湖南大学_202410089254.9

基于多GPU并行的多目标区域精细化海啸传播计算方法_国家海洋环境预报中心_202211494615.5

一种基于哈希算法的异常流量并行检测方法及系统_湖南匡安网络技术有限公司_202110305980.6

一种并行预冷的液氢加注系统及其方法_北京航天试验技术研究所_202410554802.0

模型并行训练方法、装置、设备、存储介质和程序产品_深圳市帮联科技有限公司_202011459589.3

经由多模式SLAM融合过程进行并行跟踪和定位的方法和设备_通用汽车环球科技运作有限责任公司_202010229864.6

一种高速并行接收机数据重构系统及方法_中国电子科技集团公司第十研究所_202211405449.7

受并行推理机制启发的机器人运动规划和避障决策方法_北京师范大学_202311811950.8

分布式并行任务调度方法、装置、计算机设备和存储介质_中国平安财产保险股份有限公司_201910979783.5

优化相关技术

波束网格优化_诺基亚通信公司_202311781189.8

优化地理区域选择_谷歌有限责任公司_201880094088.4

一种基于气压差对UWB定位的优化系统及优化方法_国网新疆电力有限公司电力科学研究院_202410415754.7

一种基于翠鸟优化算法实现工程优化的方法_中国矿业大学_202410413718.7

一种优化重复性的双光束测光装置及优化方法_苏州威福光电科技有限公司_202010510576.8

一种基于精英化优化法的构网器控制参数优化方法_南京工程学院_202410255660.8

基于多模态多目标优化算法的外卖配送路径优化方法_西安理工大学_202410333592.2

基站的优化方法及设备_中国联合网络通信集团有限公司_201911291061.7

通过拓扑优化设计零件_达索系统公司_201811580561.8

液压设备重复精度优化方法及系统_江苏恒源液压有限公司_202410666687.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种基于Pytorch框架的数据并行优化方法_电子科技大学_202310750946.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务