首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于生成度量TD3的茶叶智能化拼配方法、设备和介质 

申请/专利权人:安徽农业大学

申请日:2023-03-06

公开(公告)日:2024-05-14

公开(公告)号:CN116189176B

主分类号:G06V20/68

分类号:G06V20/68;G06V10/58;G06V10/764;G06V10/82;G06V10/77;G06N3/0464;G06N3/0475;G06N3/094;G06N3/048;G06N3/045;G06N3/082;G06N3/092

优先权:

专利状态码:有效-授权

法律状态:2024.05.14#授权;2023.06.16#实质审查的生效;2023.05.30#公开

摘要:本发明公开了一种基于生成度量TD3的茶叶智能化拼配方法、设备和介质,该方法包括:1、获取茶叶的高光谱图像并从中提取光谱数据;2、基于茶叶高光谱特征数据,利用ACGAN训练茶叶高光谱生成网络,用于生成状态变换后新状态下的茶样特征;3、基于深度度量学习方法训练样品相似性判别网络,判断拼配方法拼配的茶样是否满足目标样要求;4、构建GM‑TD3网络,设立拼配目标并对网络进行训练,使拼配方法在茶叶拼配问题中学习到最优策略并完成智能化拼配。本发明能根据茶叶的高光谱数据实现拼配动作与茶叶质量变化并累积经验,从而使模型学习到更优的拼配策略,实现茶叶拼配智能化。

主权项:1.一种基于生成度量TD3的茶叶智能化拼配方法,其特征在于,是按照以下步骤进行:步骤1、采集混合样茶叶、原料样茶叶的高光谱图像数据集,并从所述高光谱图像数据集中提取光谱数据集并进行MSC预处理,得到预处理后的光谱数据集,包括:混合样茶叶光谱数据集与原料样茶叶光谱数据集,其中,令混合样茶叶光谱数据集记为{Xn,Yn|n=1,2,...,N},Xn表示第n个混合样茶叶光谱,Yn表示第n个混合样茶叶光谱Xn对应的标签,N表示样本数量,且Yn∈[1,...,l,...,L];L表示标签的类别数量;令混合样茶叶光谱数据集中类别为l的混合样茶叶光谱记为{Xl_1,...,Xl_δ,...,Xl_ε};其中,Xl_δ表示类别为l的第δ份混合样茶叶光谱,ε表示类别为l的混合样茶叶的总份数;取第l种标签对应的ε份混合样茶叶光谱数据的平均值作为第l种类别的标准光谱,记为Xsl,l=1,2,...,L;原料样茶叶光谱数据集记为{X_std1,...,X_stdm,...,X_stdm’,...,X_stdM},其中,X_stdm表示第m种原料样茶叶光谱,X_stdm’表示第m’种原料样茶叶光谱,m,m’=1,2,...,M;M为原料样茶叶的种类数;步骤2、建立ACGAN茶叶光谱生成对抗网络,包括:茶叶光谱生成器、茶叶光谱判别器;所述茶叶光谱生成器包括两个结构相同、参数不同的卷积神经网络和一个反卷积网络;其中,任意一个卷积神经网络依次包括:若干个卷积层和池化层的交替连接结构及一个全连接层;所述反卷积网络包括若干个反卷积层;所述茶叶光谱判别器包括若干个卷积层和池化层的交替连接结构及一个全连接层;设第n个混合样茶叶光谱Xn对应的混合样茶叶由i份第m种原料样茶叶与j份第m’种原料样茶叶混合而成;步骤2.1、将i份第m种原料样茶叶光谱X_stdm与j份第m’种原料样茶叶光谱X_stdm’输入茶叶光谱生成器中进行处理,并得到预测光谱Xn_pred;将Xn与Xn_pred输入茶叶光谱判别器中进行处理,并得到真实光谱的光谱真假值S及其光谱分类标签C,以及预测光谱的真假值S’及其预测光谱分类标签C’;步骤2.2、利用Adam优化器对所述ACGAN茶叶光谱生成对抗网络进行训练,并计算损失函数LG和LD以更新网络参数,直至所述损失函数LG和LD收敛为止,从而得到训练好的ACGAN茶叶光谱生成对抗网络,包括:训练好的茶叶光谱生成器G和训练好的茶叶光谱判别器D;步骤3、构建深度度量学习茶叶品质判断网络Tea-DML,包括:若干个卷积层和池化层的交替连接结构及一个全连接层;将第n个混合样茶叶光谱Xn以及类别为l的第δ份混合样茶叶光谱Xl_δ输入Tea-DML中,并对Tea-DML训练,从而获得训练好的深度度量学习茶叶品质判断网络Tea-DML,用于对类别为l的混合样茶叶光谱{Xl_1,...,Xl_δ,...,Xl_ε}和类别为l的标准光谱Xsl进行度量空间特征的计算,并得到类别为l的混合样茶叶的类内距Dl;步骤4、构建GM-TD3网络,包括:茶叶拼配策略网络TP-pnet、茶叶拼配目标策略网络target-TP-pnet、两个茶叶拼配评估Q值网络Critic1与Critic2、两个茶叶拼配目标评估Q值网络target-Critic1与target-Critic2;其中,TP-pnet与target-TP-pnet为两个结构相同的网络,包括:u个全连接层;Critic1、Critic2、target-Critic1与target-Critic2为四个结构相同的网络,包括v个全连接层;步骤4.1、以类别为l的标准光谱Xsl作为目标茶样;将待配比的i份混合样茶样作为当前时刻的待配比的混合样茶样,并将其状态记为state_now,且state_now=[p1,...,pm,...,pm’,...,pM],其中,pm为第m种原料样茶叶的份数,pm’为第m’种原料样茶叶的份数;将状态state_now对应混合样茶叶的光谱特征作为当前时刻下的茶叶光谱特征记为X_now;令拼配动作a表示为某种原料样茶叶的份数增大或减小,且a属于A,A表示拼配动作向量,且A=[a1,a2,...,a2m-1,a2m,...,a2M-1,a2M],其中,a2m-1,a2m分别表示第m种原料样茶叶光谱增加j份或减少j份;步骤4.2、所述茶叶拼配策略网络TP-pnet对当前时刻下的状态state_now进行处理,生成维度为2M的拼配动作向量a_now,并选取a_now中的最大值作为下一时刻的拼配动作;步骤4.3、将状态state_now对应的茶叶光谱特征X_now及其份数i、第m种原料样茶叶光谱X_stdm及其份数j送入训练好的茶叶光谱生成器G中进行处理,由两个卷积神经网络分别得到当前时刻下的状态state_now对应的茶叶光谱运算空间特征X_now_h、第m种原料样茶叶光谱X_stdm的运算空间特征X_stdm_h;步骤4.4、若a_now中最大元素为a2m-1,则执行的拼配动作为向状态为state_now的待配比的i份混合样茶样中加入份数为j的第m种原料样,从而得到下一时刻的状态state_new=[p1,...,pm+j,...,pm’,...,pM]及其拼配后的混合样茶样,并根据式5计算生成光谱运算空间求和特征X_sum; 5若a_now中最大元素为a2m,则执行的拼配动作为从状态为向状态为state_now的待配比的i份混合样茶样中减少份数为j的第m种原料样,从而得到下一时刻的状态state_new=[p1,...,pm-j,...,pm’,...,pM]及其拼配后的混合样茶样,并根据式6计算生成光谱运算空间求和特征X_sum; 6步骤4.5、所述生成光谱运算空间求和特征X_sum经过训练好的茶叶光谱生成器G中反卷积神经网络的处理后,得到下一时刻的状态state_new对应的茶叶光谱特征X_new;步骤4.6、将当前时刻的状态state_now对应的茶叶光谱特征X_now输入训练好的深度度量学习茶叶品质判断网络Tea-DML中进行处理,得到度量空间中当前时刻状态的当前光谱度量特征dX_now;将下一时刻的状态state_new对应的茶叶光谱特征X_new输入训练好的深度度量学习茶叶品质判断网络Tea-DML中进行处理,得到度量空间中下一时刻状态的未来光谱度量特征dX_new,计算dX_new与第l种类别标准光谱Xsl的度量空间特征Xsl_dm之间的欧氏距离dnew_s;步骤4.7、若dnew_sDl,则表示下一时刻的状态state_new所对应的拼配后的混合样茶样的质量满足标准样要求,并令势能回报r为固定值,令标志符done=1;否则,表示下一时刻的状态state_new所对应的拼配后的混合样茶的质量未满足标准样要求,并根据式7获得势能回报r,并令标志符done=0: 7步骤4.8、向经验池中累积一组经验{state_now,A,r,state_new,done},并将下一时刻的状态state_new更新后的当前时刻下的状态后,返回步骤4.1顺序执行,从而不断向经验池中累积多组经验;从经验池中抽取多组经验,并利用均方误差更新Critic1、Critic2、target-Critic1与target-Critic2网络的参数,通过最大化TP-pnet与target-TP-pnet网络得到的Q值更新TP-pnet与target-TP-pnet的网络参数,从而完成GMTD3网络的训练,并用于实现茶叶的智能化拼配。

全文数据:

权利要求:

百度查询: 安徽农业大学 基于生成度量TD3的茶叶智能化拼配方法、设备和介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。