Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜中国科学技术大学张勇东获国家专利权

恭喜中国科学技术大学张勇东获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜中国科学技术大学申请的专利开放词汇图像语义分割方法、系统、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119723096B

龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510227653.1,技术领域涉及:G06V10/26;该发明授权开放词汇图像语义分割方法、系统、设备及存储介质是由张勇东;谢洪涛;葛健男;李攀登设计研发完成,并于2025-02-27向国家知识产权局提交的专利申请。

开放词汇图像语义分割方法、系统、设备及存储介质在说明书摘要公布了:本发明公开了一种开放词汇图像语义分割方法、系统、设备及存储介质,它们是一一对应的方案,相关方案与传统的方法不同,不仅能够生成准确且多样的识别结果,涵盖了属性和多层次语义信息,并且,通过视觉到语言的学习,具有更强的泛化能力,能够更灵活地处理不同的视觉内容,并能够有效识别开放场景中的目标;通过实验结果表明,本发明的方案可以在多个数据集上提升开放词汇图像语义分割性能,此外,本发明的方案也具有高可扩展性,其有潜力作为一个自动化系统,用于自动化的标注。

本发明授权开放词汇图像语义分割方法、系统、设备及存储介质在权利要求书中公布了:1.一种开放词汇图像语义分割方法,其特征在于,包括:步骤1、从输入图像中分别提取视觉特征与掩码,将所述掩码作为注意力掩码,结合注意力机制聚合视觉特征的局部信息,获得提案特征,并基于所述提案特征获得文本对应的特征,称为文本感知特征;步骤2、将所述文本感知特征进行视觉到语言的投影,再输入至语言模型,获得输入图像中各区域包含的类别名称和区域描述;其中,所述从输入图像中分别提取视觉特征与掩码,将所述掩码作为注意力掩码,结合注意力机制聚合视觉特征的局部信息,获得提案特征包括:引入视觉语言模型中的视觉编码器,将视觉编码器划按照层次进行划分,靠前的一部分层次用于从输入图像中提取视觉特征,靠后的一部分用于从输入图像中提取类别标记;使用预训练的掩码提取器,从输入图像中提取出掩码,并进行二值化,获得N个二值化掩码,H和W分别表示掩码的高度和宽度,为实数集符号;将所述N个二值化掩码作为注意力掩码,通过下式进行掩码更新: ;其中,i对应于第i个二值化掩码,同时也对应于第i个类别标记,i=1,…,N;j对应于第j个视觉特征,j=1,…,HW,表示第i个二值化掩码中第j个视觉特征对应的元素,为更新后的第i个二值化掩码中第j个视觉特征对应的元素;每个类别标记对应于中的一个二值化掩码;对于第i个类别标记,结合注意力机制进行更新: ;其中,为第j个视觉特征,为更新后的第i个二值化掩码,其包含HW个元素,为的第j个元素,、和分别是查询、键和值的投影,softmax为归一化指数函数;为赋值符号,也即将右侧计算结果赋值于左侧,完成更新;最终,通过更新后的N个类别标记聚合局部信息,获得提案特征,其中,C为提案特征的维度。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学技术大学,其通讯地址为:230026 安徽省合肥市包河区金寨路96号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。