申请/专利权人:沈援海
申请日:2024-03-04
公开(公告)日:2024-06-18
公开(公告)号:CN118211063A
主分类号:G06F18/214
分类号:G06F18/214;G01J3/28;G06F18/27;G06N3/0455;G06N3/0895
优先权:
专利状态码:在审-公开
法律状态:2024.06.18#公开
摘要:本发明公开了面向连续型变量回归预测的自编码器光谱数据增强方法,用于解决现有面向连续型变量回归任务时难以获得足够光谱数据的难题,通过生成高质量的合成光谱数据进而扩展训练数据集,基于该扩展训练数据集,显著提高机器学习预测模型的精度;该方法不仅可生成单目标变量标签光谱数据,适用于单目标变量回归,而且可生成多目标变量标签光谱数据,适用于多目标变量回归;该方法广泛适用于近红外光谱、拉曼光谱、激光诱导击穿光谱、荧光光谱和太赫兹等合成光谱数据的生成,可预设标签生成合成光谱数据,生成质量高且高效,完全适用于连续型变量回归预测。
主权项:1.面向连续型变量回归预测的自编码器光谱数据增强方法,其特征在于包括如下步骤:步骤1、采集光谱数据;步骤2、光谱数据集预处理,构造光谱数据及其对应的多目标变量标签的自编码训练数据;步骤3、构建面向连续型变量回归预测的自编码器;将自编码训练数据编码为低维特征编码矢量,再将低维特征编码矢量经解码重构出光谱数据;步骤4、基于预处理的光谱数据和重构的光谱数据,训练自编码器;在基于梯度方式的训练中,对最后的低维特征编码矢量采用加噪声的方法进行训练;步骤5、将部分光谱数据输入训练好的自编码器,得到部分新的合成光谱数据及其对应的标签,基于部分光谱数据及对应的合成光谱数据的相似度,更新自编码器的训练参数;步骤6、将完整的光谱数据输入自编码器,得到完整的合成光谱数据及其对应的标签;步骤7、将完整的合成光谱数据及其标签与真实光谱数据及其标签作为训练集,用于机器学习预测模型。
全文数据:
权利要求:
百度查询: 沈援海 面向连续型变量回归预测的自编码器光谱数据增强方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。