【发明公布】自适应多教师蒸馏下基于音频的目标检测方法及系统_江南大学_202410317956.8

导航：龙图腾网> 最新专利技术> 自适应多教师蒸馏下基于音频的目标检测方法及系统_江南大学_202410317956.8

申请/专利权人：江南大学

申请日：2024-03-20

公开（公告）日：2024-06-14

公开（公告）号：CN118196589A

主分类号：G06V10/82

分类号：G06V10/82;G06N3/042;G06N3/045;G06N3/0895;G06N3/096;G06V10/80;G06V10/74;G06V10/764;G10L25/03

优先权：

专利状态码：在审-公开

法律状态：2024.06.14#公开

摘要：本发明公开了自适应多教师蒸馏下基于音频的目标检测方法及系统，属于目标检测技术领域。本发明首先加入声音模态，结合RGB、深度和红外三个教师模态，利用知识蒸馏的方式指导音频学生，提高面对复杂环境的鲁棒性；此外针对模态差异和教师模型检测性能不同的问题，设计了一个自适应多教师蒸馏框架，提出了基于角度的自适应多教师损失，利用教师和学生中间层特征间的潜在关系作为教师重要性权重的指标，利用余弦相似度计算加权后的教师网络和学生网络逻辑输出层的角度损失，抑制中间层特征可能带来的无用信息和噪声信息，降低标签噪声，最后在多模态视听检测MAVD数据集中对网络进行训练和测试，结果表明本发明的检测精度优于基线网络。

主权项：1.一种自监督目标检测方法，其特征在于，所述方法采用自适应多教师蒸馏下基于音频的自监督目标检测网络实现目标检测，所述目标检测网络包括：RGB教师网络、深度教师网络、红外教师网络和音频学生网络；所述RGB教师网络是预训练好的以RGB图像为输入的目标检测网络，所述深度教师网络是预训练好的以深度图像为输入的目标检测网络，所述红外教师网络是预训练好的以红外图像为输入的目标检测网络；所述音频学生网络以未标记的音频数据作为输入，从预先训练完成的教师网络中提取知识进行训练，所述音频学生网络训练的损失函数为：Ltotal＝LOD+LAAMTLOD＝Lfocal+Lsmooth其中，LOD为目标检测损失，LAAMT为基于角度的自适应多教师损失，Lfocal为焦点损失，Lsmooth为平滑损失；所述基于角度的自适应多教师损失LAAMT的计算方法为：其中，lH表示Huber损失，Δ表示角度度量，表示第i个输入对应的加权后教师软标签，计算方法为：其中，表示第i个图像对应的第t个教师的软标签，ωt,i表示第i个输入对应的第t个教师的权重，M∈[1,2,3]对应教师数量；所述第i个输入对应的第t个教师的权重的计算方法为：其中，θt,i表示第t个教师对第i个输入的潜在因子，KLdiv·表示KL散度计算公式，C·表示特征融合，U·表示上采样，表示学生网络对第i个图像的第q层特征值，表示第t个教师网络对第i个输入的第q层特征值。

全文数据：

权利要求：

百度查询：江南大学自适应多教师蒸馏下基于音频的目标检测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种大型铜套离心铸造方法及铸造设备_扬州市雪龙铜制品有限公司_202210381652.9

下一篇：模型轻量化方法、装置、计算机设备、存储介质及程序产品_苏州元脑智能科技有限公司_202410372700.7

相关技术

一种大型铜套离心铸造方法及铸造设备_扬州市雪龙铜制品有限公司_202210381652.9

模型轻量化方法、装置、计算机设备、存储介质及程序产品_苏州元脑智能科技有限公司_202410372700.7

一种露头岩层非均质性的模型构建方法_岭南师范学院_202310948270.4

一种低漏电流层积电容器的化成铝箔的处理工艺和层积电容器_肇庆绿宝石电子科技股份有限公司_202210484604.2

用于铝基复合材料焊接的超声波预热激光焊接设备_恒超源洗净科技(深圳)有限公司_202410448442.6

一种物联网设备自动化测试系统、方法、存储介质及设备_成都秦川物联网科技股份有限公司_202210603550.7

基于零代词补齐的汉越数据增强方法_昆明理工大学_202210374347.7

利拉鲁肽的合成_拜康有限公司_201780086325.8

一种防治猪繁殖与呼吸道综合征的复方中药可溶性粉的制备方法和应用_广东海大集团股份有限公司_202211577992.5

一种汽车排气管制作加工焊接装置_潍坊鸿洋机械科技有限公司_202410431304.7

点云处理的方法、系统、电子设备及计算机可读存储介质_合众新能源汽车股份有限公司_202210573918.X

耐拉伸航空用电缆_广东南缆电缆有限公司_202410436836.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】自适应多教师蒸馏下基于音频的目标检测方法及系统_江南大学_202410317956.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务