首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

版面数据合成方法、设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:苏州开心盒子软件有限公司

摘要:本发明公开了一种版面数据合成方法、设备及存储介质。该方法包括:将获取的纯文本图像进行自适应二值化处理,得到纯文本二值化图像。基于纯文本二值化图像,获取纯文本图像中文字区域的像素坐标和像素值。对纯文本二值化图像进行行列分割处理,得到文本行的坐标、文本分栏的数量以及文本分栏的坐标。基于文本行的坐标、文本分栏的数量、文本分栏的坐标以及包含至少一个插入数据的插入数据库,确定至少一个待插入数据以及各待插入数据的坐标。基于背景数据库中目标背景图像、文字区域的像素坐标和像素值以及至少一个待插入数据和各待插入数据的坐标,合成版面数据。本发明实现了合成版面数据。

主权项:1.一种版面数据合成方法,其特征在于,包括:将获取的纯文本图像进行自适应二值化处理,得到纯文本二值化图像;基于所述纯文本二值化图像,获取所述纯文本图像中文字区域的像素坐标和像素值;对所述纯文本二值化图像进行行列分割处理,得到文本行的坐标、文本分栏的数量以及所述文本分栏的坐标;基于所述文本行的坐标、文本分栏的数量、所述文本分栏的坐标以及包含至少一个插入数据的插入数据库,确定至少一个待插入数据以及各所述待插入数据的坐标;基于背景数据库中目标背景图像、所述文字区域的像素坐标和像素值以及至少一个待插入数据和各所述待插入数据的坐标,合成版面数据,所述版面数据具有标签,所述标签用于指示所述版面数据对应图像中每个像素的像素类别;所述基于所述文本行的坐标、文本分栏的数量、所述文本分栏的坐标以及包含至少一个插入数据的插入数据库,确定至少一个待插入数据以及各所述待插入数据的坐标,包括:确定所述文本分栏的数量至少为1时,针对每个文本分栏,根据所述文本分栏的坐标以及各所述文本行的坐标,确定所述文本分栏中所包括文本行的文本属性信息,其中所述文本属性信息包括:所述文本分栏中所包括文本行的行数以及所述文本分栏中所包括文本行的行宽度值和行高度值;确定待插入数据的预设数量,选取所述插入数据库中一个插入数据作为当前待插入数据;根据所述当前待插入数据的宽高属性值及所述文本属性信息,确定所述当前待插入数据的坐标;返回执行新的当前待插入数据的选定操作,直至被选定的所述插入数据的数量与所述预设数量相等;所述根据所述当前待插入数据的宽高属性值及所述文本属性信息,确定所述当前待插入数据的坐标,包括:按照预设比例将所述宽高属性值中的宽度值以及所述宽高属性值中高度值缩放,所述预设比例为所述宽高属性值中的宽度值与所述文本属性信息内所包括文本行的行宽度值的比值;根据所述文本属性信息内所包括文本行的行高度值,确定所述当前待插入数据的占行数;获取所述当前待插入数据所对应的文本分栏已占行数,所述文本分栏已占行数是基于上一待插入数据的占行数以及目标起始行确定;如果预备占行数小于或等于所述文本属性信息内所包括文本行的行数,则确定所述当前待插入数据的目标起始行,所述目标起始行大于所述文本分栏已占行数,基于所述当前待插入数据的占行数、所述目标起始行以及所述文本分栏中所包括文本行的行宽度值,确定所述当前待插入数据的坐标,所述预备占行数为所述当前待插入数据的占行数与所述文本分栏已占行数之和。

全文数据:

权利要求:

百度查询: 苏州开心盒子软件有限公司 版面数据合成方法、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。