首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于SwinTransformer实现车内气味的现场快速评价方法_北京化工大学_202311839262.2 

申请/专利权人:北京化工大学

申请日:2023-12-28

公开(公告)日:2024-04-09

公开(公告)号:CN117849253A

主分类号:G01N30/86

分类号:G01N30/86;G06N3/0455;G06N3/08

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.26#实质审查的生效;2024.04.09#公开

摘要:基于SwinTransformer实现车内气味的现场快速评价方法属于环境领域。首先利用具有富集功能的便携快速色谱对车内环境气体中VOCs进行测试,得到车内不同种类和浓度的挥发性有机物VOC的色谱图,同时进行气味评价。基于测定车内空气中VOCs的色谱图及对应的气味强度,使用SwinTransformer进行训练,建立气味模型。经训练该模型能根据色谱图准确区分不同的车内气味强度,实现车内气味的现场客观评价;搭建的SwinTransformer模型在便携式设备上单张图片的前向传播,计算气味结果用时短,小于0.7s。本发明将模型嵌入到便携式设备的操作系统中实现现场快速的气味评价。

主权项:1.基于SwinTransformer实现车内气味的现场快速评价方法,其特征在于:该方法分为以下三个步骤:1便携式气相VOCs色谱图和气味的检测和收集、2SwinTransformer模型的构建、3现场气味快速客观评价;1便携式气相VOCs色谱图和气味的检测和收集使用的模型是监督学习方法,因此需要收集建模的输入和标签信息;模型的输入为便携式气相色谱测试的色谱图,标签为现场评价的气味强度1-6级;评价的气味强度均精确到0.5级并进行收集;在收集色谱图时,将所有色谱图的纵坐标轴统一调整,使其与色谱图中最高峰的响应值对齐;2SwinTransformer模型的构建和训练色谱图以长方形进行选取,对于收集到的色谱图,先会将图片压缩到224×112×1.15的格式,然后裁剪出224×112的区域这是为了去掉坐标轴;随后将处理后的色谱图送入模型进行计算;所使用的模型的名称为swin_tiny_patch4_window7_224,它使用7×7的窗口大小做自注意力机制运算,该模型由4个阶段stage的SwinTransformer编码器和分类层构成,每个stage内部由若干W-MSA,SW-MSA两个block模块组成;该结构详细的参数如下:{in_chans=3,patch_size=4,window_size=7,embed_dim=96,depths=2,2,6,2,num_heads=3,6,12,24}in_chans为图片输入通道数,这表述输入的色谱图是RGB三通道的;patch_size=4表示:首先,输入的色谱图的长和宽会被压缩为原图14,这个过程是由embed_dim=96个大小为[4×4]的卷积核,以Stride=[4×4]卷积实现的,这个过程也被称为PatchEmbed;经过PatchEmbed的特征图尺寸为28×56;window_size=7表示,要将28×56的特征图划分为32个大小为7×7的小窗口,这个过程称为window_partition,经过这个过程后输出的特张图为32,49,96,随后对于这个特征图使用W-MSA来进行窗口内的自注意力计算;W-MSA的自注意力计算如式1所示: 其中,Qquery、Kkey、Vvalue分别是通过输入向量X32,49,96乘以三个不同的权值矩阵WQ、WK、WV得到的;是k向量的维度,是一个缩放因子;B代表相对位置偏置;使用的矩阵WQ、WK、WV的形状为32,3,49,32,32代表窗口的个数,3表示第一个stage中多头注意力机制头的数量;num_heads=3,6,12,24这个参数分别定义了四个stage中各自的头数;49表示窗口的大小32则表示每个头处理的特征图个数963;输入数据在经过W-MSA中的WQ、WK矩阵计算后,得到的特征图的维度为32,3,49,49;这里,32表示窗口的数量,3表示注意力头的数量,而49×49则表示每个窗口内部的自注意力得分矩阵;这意味着,在W-MSA操作后,每个注意力头都会为每个窗口生成一个自注意力得分矩阵;这个得分矩阵捕获了窗口内部各个元素之间的关联性;随后该矩阵经过Softmax函数计算确保所有的注意力权重都在0和1之间,并且它们的总和为1;随后该矩阵与v矩阵相乘并将三个头的结果加和后得到最终W-MSA的输出维度为32,49,96;这里,32表示窗口的数量,49表示每个窗口内部的元素数量,96则表示每个元素的特征维度;这意味着,在W-MSA操作后,每个窗口内的每个元素都会生成一个96维的特征向量;经过W-MSA窗口计算后,矩阵通过线性层处理并经过window_reverse将输出维度还原为28,56,96,随后经过SW-MSA层进行注意力计算;边缘的窗口将其补齐成完整窗口的大小进行窗口内注意力计算,对于由位移导致的出现在同一个小窗口内但原本在图中并不相交的区域,使用遮盖机制mask给对应位置加上一个100,然后经过Softmax计算;depths=2,2,6,2,这个参数表示在第一个Stage中Block的个数为2,也就是说W-MSA和SW-MSA的Block各有一个,其余三个Stage以此类推;num_heads=3,6,12,24表示每个Stage使用多头注意力机制的头数;在数据进入下一个Stage之前,需要进行Patch_merging用于缩小图片的分辨率和调整通道数,在经过该模块后,特征图会被缩放到原本长和宽的12,通道数会变为2;第一个stage后数据的维度会变为14,28,192,同样的方法进行第二个Stage的计算;在经过4个Stage计算后,特征图的维度变成了4,7,768,全局信息都包含在了这768个通道中;随后这个将这个矩阵会经过一个自适应的平均池化层将特征转为1×768并将其回归到气味强度类别上,最终的输出形式是以独热编码的形式输出不同气味强度级别的预测概率;使用交叉熵损失函数进行损失的计算,使用AdamW作为训练的优化器,并将L2正则化惩罚因子设置为0.05,训练时模型读取基于ImageNet-1K数据集训练的预训练权重作为初始权重,并在此基础上训练模型;2现场气味快速客观评价将模型以python脚本和模型权重文件的形式嵌入在设备的操作软件中;在完成的VOCs检测后,使用命令行调用Python脚本运行并读取保存后的色谱图文件,执行Python脚本,计算气味预测并返回输出,从而实现现场的快速评价。

全文数据:

权利要求:

百度查询: 北京化工大学 基于SwinTransformer实现车内气味的现场快速评价方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。