首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种图片信息的处理方法、装置及电子设备_北京搜狗科技发展有限公司_202010366994.4 

申请/专利权人:北京搜狗科技发展有限公司

申请日:2020-04-30

公开(公告)日:2024-06-18

公开(公告)号:CN113590861B

主分类号:G06F16/55

分类号:G06F16/55;G06F16/535;G06F16/538;G06F16/583

优先权:

专利状态码:有效-授权

法律状态:2024.06.18#授权;2021.11.19#实质审查的生效;2021.11.02#公开

摘要:本发明公开了一种图片信息的处理方法、装置及电子设备,该方法包括:对网页中的图片进行重复图片聚类,获取每个类簇图片的标记文本域集合;针对每张类簇图片,根据标记文本域集合获取标记文本域集合中每个标记文本域包含有的关键词及其词权重,词权重用于反映关键词和类簇图片的相关度;根据每张类簇图片对应的所有关键词的词权重,获取每张类簇图片的目标关键词;根据每张类簇图片的目标关键词及其词权重,对图片搜索结果进行排序。在上述技术方案中,通过重复图片聚类获取大量的标记文本域,选取图片的目标关键词及其词权重,据此进行图片搜索结果的排序,解决了现有技术中因图文不符导致的图片搜索排序准确性降低的技术问题。

主权项:1.一种图片信息的处理方法,其特征在于,所述方法包括:对网页中的图片进行重复图片聚类,获取每个类簇的类簇图片和所述类簇图片的标记文本域集合;针对每张类簇图片,根据所述标记文本域集合获取所述标记文本域集合中每个标记文本域包含有的关键词及所述关键词的词权重,其中,所述词权重用于反映所述关键词和类簇图片的相关度;根据每张类簇图片对应的所有关键词的词权重,对所有关键词进行排序,获取词权重最大的前n位关键词作为目标关键词,从而获取每张类簇图片的目标关键词;根据每张类簇图片的所述目标关键词及所述目标关键词的词权重,对图片搜索结果进行排序;所述根据所述标记文本域集合获取所述标记文本域集合中每个标记文本域包含有的关键词及所述关键词的词权重,包括:获取所述每个标记文本域中的关键词;针对每个关键词获得如下目标参数:所述关键词在所属标记文本域中的词频和出现次数以及所述关键词对应的网站域名个数;根据每个所述关键词的所述目标参数,计算获得每个所述关键词的词权重。

全文数据:

权利要求:

百度查询: 北京搜狗科技发展有限公司 一种图片信息的处理方法、装置及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。