首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于轻量化视觉转换器的儿童邪典图片识别方法和设备_华侨大学_202410389340.1 

申请/专利权人:华侨大学

申请日:2024-04-02

公开(公告)日:2024-06-21

公开(公告)号:CN117975173B

主分类号:G06V10/764

分类号:G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/048

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2024.05.21#实质审查的生效;2024.05.03#公开

摘要:本发明提供一种基于轻量化视觉转换器的儿童邪典图片识别方法和设备,涉及图像识别技术领域。识别方法包含S1、获取待识别的卡通图像。S2、对卡通图像进行预处理。S3、预处理后的卡通图像输入训练好的基于轻量化视觉转换器的实时儿童邪典图片识别模型,获取预测向量。S4、基于预测阈值对预测向量进行比较判断,以判断卡通图像是否属于儿童邪典图片。基于轻量化视觉转换器的实时儿童邪典图片识别模型的网络结构包括依次连接的第一卷积层网络、第一移动网络、第二移动网络、第三移动网络、第四移动网络、第一轻量化转换器网络、第五移动网络、第二轻量化转换器网络、第六移动网络、第三轻量化转换器网络、第二卷积层网络和多层感知机。

主权项:1.一种基于轻量化视觉转换器的儿童邪典图片识别方法,其特征在于,包含:获取待识别的卡通图像;根据所述卡通图像进行预处理;将预处理后的卡通图像输入预先训练好的基于轻量化视觉转换器的实时儿童邪典图片识别模型,获取卡通图像中用于判断是否属于儿童邪典图片的预测向量;基于预测阈值对所述预测向量进行比较判断,以判断所述卡通图像是否属于儿童邪典图片;其中,所述基于轻量化视觉转换器的实时儿童邪典图片识别模型的网络结构包括依次连接的第一卷积层网络、第一移动网络、第二移动网络、第三移动网络、第四移动网络、第一轻量化转换器网络、第五移动网络、第二轻量化转换器网络、第六移动网络、第三轻量化转换器网络、第二卷积层网络和多层感知机;所述第一卷积层网络输入是大小为256×256×3的图片,输出为大小128×128×16的向量;所述第一移动网络的输出为128×128×16的向量;所述第二移动网络的输出为64×64×24的向量;所述第三移动网络的输出为64×64×24的向量;所述第四移动网络的输出为32×32×48的向量;所述第一轻量化转换器网络的输出为32×32×48的向量;所述第五移动网络的输出为16×16×64的向量;所述第二轻量化转换器网络的输出为16×16×64的向量;所述第六移动网络的输出为8×8×80的向量;所述第三轻量化转换器网络的输出为8×8×80的向量,第三轻量化转换器网络由4个卷积层网络和3个转换器模块连接组成;所述第二卷积层网络的输出为8×8×320的向量;所述多层感知机的输出为1×1×2的置信度;所述第一卷积层网络包含顺序连接的卷积层、批量归一化层和SiLU激活函数;其中,所述第一卷积层网络的卷积层包含n=16个大小为3×3的卷积核;所述第二卷积层网络包含顺序连接的卷积层、批量归一化层和SiLU激活函数;其中,所述第二卷积层网络的卷积层包含n=320个大小为1×1的卷积核;所述第一移动网络和所述第三移动网络均采用残差结构;残差结构的移动网络包含依次连接的分组卷积、批量归一化层、SiLU激活函数、卷积层、批量归一化层、SiLU激活函数和加法操作;所述第一移动网络的分组卷积包含32个大小为3×3的卷积核,并设置对应的步长为1,对应的组数量为32;所述第一移动网络的卷积层包含16个大小为1×1的卷积核,并设置对应的步长为1,对应的填充为0;所述第三移动网络的分组卷积包含48个大小为3×3的卷积核,并设置对应的步长为1,对应的组数量为48;所述第三移动网络的卷积层包含24个大小为1×1的卷积核,并设置对应的步长为1,对应的填充为0;所述第二移动网络、第四移动网络、第五移动网络和第六移动网络均采用顺序连接结构;顺序连接结构的移动网络包含依次连接的分组卷积、批量归一化层、SiLU激活函数、卷积层、批量归一化层和SiLU激活函数;所述第二移动网络的分组卷积包含32个大小为3×3的卷积核,并设置对应的步长为1,对应的组数量为32;所述第二移动网络的卷积层包含24个大小为1×1的卷积核,并设置对应的步长为1,对应的填充为0;所述第四移动网络的分组卷积包含48个大小为3×3的卷积核,并设置对应的步长为1,对应的组数量为48;所述第四移动网络的卷积层包含48个大小为1×1的卷积核,并设置对应的步长为1,对应的填充为0;所述第五移动网络的分组卷积包含96个大小为3×3的卷积核,并设置对应的步长为1,对应的组数量为96;所述第五移动网络的卷积层包含64个大小为1×1的卷积核,并设置对应的步长为1,对应的填充为0;所述第六移动网络的分组卷积包含128个大小为3×3的卷积核,并设置对应的步长为1,对应的组数量为128;所述第六移动网络的卷积层包含80个大小为1×1的卷积核,并设置对应的步长为1,对应的填充为0;轻量化转换器网络包含依次连接的一号卷积层网络、二号卷积层网络、向量拉伸操作、多个转换器模块、向量拉伸操作和三号卷积层网络;其中,所述一号卷积层网络包含顺序连接的卷积层、批量归一化层和SiLU激活函数;所述一号卷积层网络的卷积核大小为3×3;所述二号卷积层网络和所述三号卷积层网络均包含顺序连接的卷积层、批量归一化层和SiLU激活函数;所述二号卷积层网络和所述三号卷积层网络的卷积核大小为1×1;第一轻量化转换器网络的一号卷积层的卷积核数量为48;第一轻量化转换器网络的二号卷积层的卷积核数量为64;第一轻量化转换器网络的三号卷积层的卷积核数量为48;第二轻量化转换器网络的一号卷积层的卷积核数量为64;第二轻量化转换器网络的二号卷积层的卷积核数量为80;第二轻量化转换器网络的三号卷积层的卷积核数量为64;第三轻量化转换器网络的一号卷积层的卷积核数量为80;第三轻量化转换器网络的二号卷积层的卷积核数量为96;第三轻量化转换器网络的三号卷积层的卷积核数量为80;所述第一轻量化转换器网络的转换器模块的数量为2个;所述第二轻量化转换器网络的转换器模块的数量为4个;所述第三轻量化转换器网络的转换器模块的数量为3个;所述转换器模块包含连接的注意力层和前馈网络;转换器模块的注意力层包含顺序连接的第一层归一化层、第一线性层、向量拉伸操作、注意力操作、向量拉伸操作和第二线性层;转换器模块的前馈网络包含顺序连接的第二层归一化层、第三线性层、SiLU激活函数、第一Dropout随机失活、第四线性层和第二Dropout随机失活;其中,第一线性层的输出维度为96;第二线性层的输出维度和转换器模块的输入向量维度相同;第三线性层的输出维度为转换器模块输入向量的两倍;第四线性层的输出维度和转换器模块的输入向量维度相同;第一Dropout随机失活和第二Dropout随机失活的失活率都为0.1。

全文数据:

权利要求:

百度查询: 华侨大学 基于轻量化视觉转换器的儿童邪典图片识别方法和设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。