恭喜重庆邮电大学杨烽获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜重庆邮电大学申请的专利一种基于时空多尺度Transformer的航拍视频分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115223082B 。
龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210844866.5,技术领域涉及:G06V20/40;该发明授权一种基于时空多尺度Transformer的航拍视频分类方法是由杨烽;周博通;舒文强;张健;赵杰;高陈强设计研发完成,并于2022-07-19向国家知识产权局提交的专利申请。
本一种基于时空多尺度Transformer的航拍视频分类方法在说明书摘要公布了:本发明属于遥感影像智能化分析领域,具体涉及一种基于时空多尺度Transformer的航拍视频分类方法,包括:对航拍视频数据进行预处理,输入至训练完成的航拍视频识别模型,通过嵌入特征偏移模块和池化多头自注意力模块的多尺度时空特征提取模块,得到航拍视频图像帧的多尺度短时序时空特征,再通过空洞时间特征提取模块在时间维度上计算空洞自注意力,得到航拍视频的长时序时空特征,从而对航拍视频数据进行准确高效的识别分析。本发明通过充分挖掘航拍视频的多尺度时空信息,能够有效提升航拍视频的分类精度,并且在时间维度上实现自注意力计算的线性复杂度,从而降低了模型的运算复杂度。
本发明授权一种基于时空多尺度Transformer的航拍视频分类方法在权利要求书中公布了:1.一种基于时空多尺度Transformer的航拍视频分类方法,所述方法包括:获取航拍视频数据,并对所述航拍视频数据进行预处理;将预处理后的航拍视频数据输入到训练好的基于多尺度Transformer的航拍视频识别模型中,输出识别结果;其特征在于,基于多尺度Transformer的航拍视频识别模型包括将2Dtransformer网络作为主干网络,所述2Dtransformer网络包括预编码模块、由多级编码块结构构成的多尺度时空特征提取模块、空洞时间特征提取模块ETM、以及全连接层的分类器;其中,每一级编码块结构包括多层编码块,每一层编码块依次包括第一特征偏移模块FS、第一归一化层、池化多头自注意力模块PMHA或者标准多头自注意力模块MHA、第一Dropout层、第二特征偏移模块FS、第二归一化层、多层感知器MLP以及第二Dropout层,其中,第一归一化层、池化多头自注意力模块PMHA以及第一Dropout层构成残差结构,第二归一化层、多层感知器MLP以及第二Dropout层构成残差结构;所述预编码模块位于2Dtransformer网络头部,所述分类器位于2Dtransformer网络尾部,所述特征提取模块和所述空洞时间特征提取模块ETM位于2Dtransformer网络中部,且所述空洞时间特征提取模块ETM插入特征提取模块与全连接层的分类器之间;其中,空洞时间特征提取模块ETM在时间维度上操作过程包括:最后一层编码块的输出为长度为t的分类标记CLStoken序列X,将序列X输入至空洞时间特征提取模块ETM,此时的分类标记CLStoken代表着每帧图像的帧分类信息,X表示拼接上视频分类特征tokenclst的CLStoken序列;若CLStoken序列长度低于预设长度,则计算全局自注意力,反之计算空洞时序自注意力,按照自注意力确定出CLStoken序列;计算空洞时序自注意力的过程包括在CLStoken序列左右拼接为的全零掩码,空洞间隔为d,空洞的长度为n,每次沿时间维度滑动1帧距离;空洞时序自注意力与全局自注意力的计算公式如下:ΩT-MSA=tft 其中,ΩT-MSA为时间维度的全局自注意力,ΩTW-MSA为时间维度的空洞自注意力,t为视频帧的序列长度,fx为长度为x的序列的自注意力计算量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。