恭喜广州市久邦数码科技有限公司邓裕强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜广州市久邦数码科技有限公司申请的专利一种含文字图片的关键词语检索方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114328804B 。
龙图腾网通过国家知识产权局官网在2025-03-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202011029418.7,技术领域涉及:G06F16/3332;该发明授权一种含文字图片的关键词语检索方法及系统是由邓裕强;朱志设计研发完成,并于2020-09-27向国家知识产权局提交的专利申请。
本一种含文字图片的关键词语检索方法及系统在说明书摘要公布了:本发明公布一种含文字图片的关键词检索方法及系统,通过文字识别、文字检索,目标词语定位三个阶段,可以在不可编辑的pdf文档,图片上,轻易检索出用户所需的关键词,以及用户所需求的具体页码,解决了广大用户,无法在庞大数量的图片、不可编辑文字pdf文档中,以关键词语查到,检索具体页面,具体内容的难题,能够轻松满足户外学习过程中,通过关键词定位到用户所需的具体页面。
本发明授权一种含文字图片的关键词语检索方法及系统在权利要求书中公布了:1.一种含文字图片的关键词语检索方法,包括以下步骤:S1:利用OCR识别技术,识别待处理图片集或不可编辑PDF文档中各个页面上的元素内容,按照顺序依次排列,S1包含以下子步骤:S101:依照顺序读取待识别图片集元素,并进行文字,格式矫正,干扰元素去除,所述图片集包括.jpg、.png或pdf文档图片集形式;S102:标注图片中各个元素坐标,并记录;S103:生成.doc或.docx文档,对应的,所述文档标有页码,依照图片集顺序,依次转换成文档页面;进一步的,所述文档页码对应唯一一张图片;S2:通过深度学习网络,从文字文档中,检索出所需的关键词语,S2还包括以下子步骤:S201:深度学习网络识别.doc或.docx文档中的文字,并进行准确记忆;S202:确定需要检索的关键词语,校验后,输入深度学习网络模型中;S203:通过训练好的深度学习网络定位到具体的关键词语,进行标记,并记录关键词语坐标和文档页码;进一步的,所述关键词语对应的坐标至少有1个;所述文档页码至少包含1个关键词语坐标;所述关键词语至少位于一个文档页码;S3:通过定位坐标和页码,实现对图片、不可编辑pdf文档内容的关键词定位检索,S3还包括以下子步骤:S301:识别关键词语坐标和文档页码,通过深度学习网络,根据文档页码定位原图片;S302:通过关键词语坐标,定位到原图片中关键词语词位置。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州市久邦数码科技有限公司,其通讯地址为:510055 广东省广州市越秀区中山三路33号中华国际中心A塔1601、1604-1、1605-1606、1701、1702-1、1703-1、1704-1708单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。