首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

对图像进行语义分割的方法及装置 

申请/专利权人:清华大学

申请日:2021-12-31

公开(公告)日:2024-06-28

公开(公告)号:CN114494693B

主分类号:G06V10/26

分类号:G06V10/26;G06V10/774;G06V10/82;G06N3/0464;G06N3/0895

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2022.05.31#实质审查的生效;2022.05.13#公开

摘要:本发明公开了一种对图像的初始的类激活图进行修正的方法、系统和计算机程序产品,方法包括:获取所述图像的超像素信息;利用所述图像的超像素信息,将所述图像分成多个区域,其中所述多个区域的每个区域的相关信息包括:与该区域相邻的区域以及该区域的所有像素;获取所述图像的所述初始的类激活图,所述类激活图是所述图像中的所有像素分类到所述图像中所含对象的类别中各个类别的概率值,特定类别概率值为特定类别的激活值;以及基于所述图像的所述多个区域的每个区域的相关信息对所述图像的所述初始的类激活图进行修正。修更后的类激活图能够更好地对图像进行语义分割。

主权项:1.一种对图像的初始的类激活图进行修正的方法,其特征在于,包括:获取图像的超像素信息;利用所述超像素信息将所述图像分成多个区域,并获取所述多个区域中每个区域的相关信息,其中所述相关信息包括:与该区域相邻的区域以及该区域的所有像素;获取所述图像的初始类激活图,所述类激活图是所述图像中的所有像素分类到所述图像中所含对象的类别中各个类别的概率值,特定类别的概率值为特定类别的激活值;以及基于所述图像的所述多个区域中每个区域的相关信息对所述图像的所述初始类激活图进行修正;基于所述图像的所述多个区域中每个区域的相关信息对所述图像的所述初始类激活图进行修正,包括:所述类别包括多个第一特定类别,对每一第一特定类别执行如下步骤:将所述多个区域的每个区域的第一特定类别处理状态初始化为未处理;对所有未处理区域循环执行如下步骤:获得第一特定类别处理状态为未处理的所有区域中的像素中对应的所述第一特定类别上的激活值为最大激活值的第一像素,所述第一像素的所述第一特定类别上的激活值为第一激活值;判断所述第一激活值是否大于第一预设阈值;响应于所述第一激活值不大于第一预设阈值,结束对所有未处理区域循环执行的处理;响应于所述第一激活值大于第一预设阈值,根据所述图像的所述多个区域的每个区域的相关信息,获得所述第一像素对应的第一区域;判断所述第一区域中包含的所有像素的所述第一特定类别上的激活值是否满足预设条件;响应于所述第一区域中包含的所有像素的所述第一特定类别上的激活值满足预设条件,使所述第一区域中包含的所有像素的所述第一特定类别上的激活值为所述第一激活值,定义所述第一区域为域内激活区域;以及更新所述第一区域的处理状态为已处理;其中所述预设条件包括以下之一:所述第一区域内所有像素的在第一特定类别的类激活值均大于用户设定的类激活值;所述第一区域内一定比例像素的在第一特定类别的类激活值大于用户设定的类激活值;以及所述第一区域内所有像素的在第一特定类别的类激活值平均值大于用户设定的类激活值;基于所述图像的所述多个区域中每个区域的相关信息对所述图像的所述初始类激活图进行修正,进一步包括:响应于所述第一区域中包含的所有像素所述第一特定类别上的激活值不满足所述预设条件,使所述第一区域中大于预设阈值的像素的所述第一特定类别上的激活值为第二激活值,并更新所述第一区域的第一特定类别处理状态为已处理;其中所述第二激活值为以下之一:所述第一区域内除所述第一特定类别激活值满足所述预设条件的像素之外的其他像素的所述第一特定类别上的激活值的平均值;所述第一区域内除所述第一特定类别激活值满足所述预设条件的像素之外的其他像素的所述第一特定类别上的激活值的中间值;所述第一区域内除所述第一特定类别激活值满足所述预设条件的像素之外的其他任意像素的所述第一特定类别上的激活值;以及用户预设的激活值。

全文数据:

权利要求:

百度查询: 清华大学 对图像进行语义分割的方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。