买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江工业大学
摘要:本发明属于红茶发酵技术领域,公开了一种基于数据增强和标签生成的发酵红茶儿茶素定量方法,包括以下步骤:S1.实验平台搭建;S2.发酵红茶图像数据采集与儿茶素测定;S3.发酵红茶光谱与标签数据生成;S4.生成数据质量评估;S5.数据增强效果评估。本发明提出的方法利用光谱学和机器学习做到了快速无损的检测,本方法节省了成本以及时间;本发明提出的DCGAN‑L模型相比直接利用DCGAN同时生成光谱加标签,生成的数据更加接近真实数据,不存在异常分布情况;DCGAN‑L模型,可以推广应用于各类茶叶发酵领域,以及机器学习数据增强领域,在准确定量茶类物质发酵过程中化学值含量方面潜力巨大。
主权项:1.一种基于数据增强和标签生成的发酵红茶儿茶素定量方法,其特征在于,包括以下步骤:S1.实验平台搭建:搭建实验平台,并完成设备的调试;S2.发酵红茶图像数据采集与儿茶素测定:对实验样本进行高光谱图像的数据采集,并对采集到的图像数据进行预处理,选取感兴趣区域并提取平均光谱,图像采集完成后通过超高效液相色谱对实验样本进行化学值测定;S3.发酵红茶光谱与标签数据生成:设计DCGAN-L模型,基于发酵红茶训练集数据生成假光谱数据与假标签数据;S3中用DCGAN-L模型同时生成假光谱数据及其对应的多个标签值,以扩充训练集数据样本,DCGAN-L模型包含两个生成器,分别是生成器G-Ⅰ和生成器G-Ⅱ,和一个鉴别器D,其中生成器G-Ⅰ和鉴别器D用于生成假光谱数据,生成器G-Ⅱ为假光谱数据生成标签值;S3中DCGAN-L模型中DCGAN网络结构由生成器G-Ⅰ和鉴别器D组成,生成器G-Ⅰ由连续四层反卷积层组成,DCGAN网络首先接收100×1的高斯噪声向量Z,前三层反卷积层的每一个反卷积操作后均进行批量归一化,并通过LeakyReLU激活函数处理,依次产生128×17,32×35和16×70大小的特征向量,最后一层反卷积层反卷积后接一个tanh激活函数,最终生成具有140个通道的输出光谱;鉴别器D由四层卷积层组成,其结构与生成器G-Ⅰ在顺序上呈相反,鉴别器G-Ⅰ的输入层接受1×140的光谱数据,前三层卷积后均应用LeakyReLU非线性激活函数,最后一个卷积层后接sigmoid函数,产生单一的标量,计算输入光谱被分类为真实数据的概率;S3中DCGAN-L模型中Label网络结构由人工标签生成器G-Ⅱ构成,用于给从G-Ⅰ生成的光谱数据分配标签数据,G-Ⅱ使用最近邻回归算法KNN为假光谱标记标签,将生成的假光谱和真实红茶发酵光谱映射到多维的空间中,利用KNN算法找到与假光谱数据最邻近的五个样本;找到与假光谱数据最邻近的真实光谱样本的公式如下(2): ,(2)其中Dij表示第i个假光谱数据和第j个真实数据之间的距离,Fik表示第i个假光谱的第k个波段,而Fjk表示第j个真实光谱的第k个波段,M代表光谱波段数;对于每个假光谱,在计算所有Dij后,选择最接近假光谱的真实光谱数据点,它们的距离表示为Diz,首先根据公式(3)计算五个最接近假光谱的真实光谱距离权重Wiz,公式如下(3): ,(3)其中Diz表示与生成的第i条假光谱最近的五条真实光谱之间的距离;然后使用以下权重公式给生成的第i条假光谱赋予标签值: ,(4)其中Lih表示第i条假光谱数据的第h个化学值,Czh表示最接近第i条假光谱的第z条真实光谱对应的第h个化学值,Wiz表示最接近第i条假光谱的第z条真实光谱对应的权重;DCGAN-L模型中生成器G-1和鉴别器D训练,基于Adam优化器,通过反向传播训练生成器G-Ⅰ和鉴别器D,当训练完成后固定生成器G-Ⅰ的参数,输入多个100*1的高斯噪声,最终生成多个假光谱数据,随后将多个假光谱数据输入到生成器G-Ⅱ中,为该批假光谱数据标注化学值标签,在训练过程中提出的DCGAN-L网络的超参数设置为:批次=4,学习率=0.0001,训练周期=5000,LeakyReLU函数的斜率=0.2;S4.生成标签数据质量评估:采用光谱相似性指标评估步骤S3中生成的假光谱数据的质量,采用显著性分析对比步骤S3中生成的假标签数据与真实标签数据分布的相似性,以评估生成标签数据的质量;S5.数据增强效果评估:用S3步骤中生成的假光谱数据对发酵红茶训练集进行数据增强,对比随机森林RF和宽度学习BLS两种回归模型在数据增强前后的模型性能,以评估数据增强对发酵红茶儿茶素定量分析的有效性。
全文数据:
权利要求:
百度查询: 浙江工业大学 一种基于数据增强和标签生成的发酵红茶儿茶素定量方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。