买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:盟浪可持续数字科技(深圳)有限责任公司
摘要:本发明公开了一种多模态PDF版面结构分析系统,涉及多模态PDF技术领域,解决了未对版面中多元素排版形式的分析处理,多元素涵盖文本、图片、表格、形状等,本发明针对PDF多模态中的图片这一元素为出发点,首先对图片元素进行分析处理,获取图片元素的排版信息,调整图片元素排版的尺寸,对比例进行调整,确认PDF版面中图片的位置信息,使分析后的结果信息无限接近对应解析的PDF,提高多模态PDF图片元素之间的关联性,多模态PDF版面结构分析的结果也更利于提升观看阅读体验。
主权项:1.一种多模态PDF版面结构分析系统,其特征在于,包括版面参数采集端、分析处理中心以及显示终端;所述分析处理中心包括版面参数预分析单元、阈值单元、调整单元、版面参数排版单元以及存储单元;所述版面参数采集端,用于对多模态PDF文件的版面整体图像参数进行获取,并将所获取的版面整体图像参数传输至分析处理中心内;所述分析处理中心内部的版面参数预分析单元,对所获取的版面整体图像参数进行预分析处理,从版面整体图像参数内将不同的排版图片进行提取,并获取此排版图片的面积参数,根据面积参数,获取属于同一版面的排版图片比例参数,并将比例参数与阈值单元内设阈值进行比对,通过比对结果生成对应的调整信号,具体方式为:将所获取的版面整体图像参数提取出,提取完毕后,从版面整体图像参数依次提取对应的排版图片;将不同排版图片的排版面积标记为PBi,其中i代表不同的排版图片,其中i=1、2、……、n;将若干个属于不同排版面积PBi的排版图片进行比对处理,得到比对参照值BD=PB1:PB2:……:PBn,从比对参照值BD内提取最大比值以及最小比值,采用最大比值除以最小比值得到待处理值CL;将待处理值CL与阈值单元内设阈值Y1进行比对,且内设阈值Y1的具体取值由操作人员根据经验拟定,当CL<Y1时,不生成任何处理信号,当CL≥Y1时,生产调整信号,并将调整信号传输至调整单元内;所述调整单元,根据所接收到的调整信号,对处理完毕的比对参照值BD进行参数改变,并通过所改变的参数,对排版图片的排版大小进行改变;所述版面参数排版单元,根据排版图片的个数,从存储单元内提取对应的排版模板,再将不同的排版图片设置于排版模板内,再将排版完毕后的整体PDF版面传输至显示终端内进行显示。
全文数据:
权利要求:
百度查询: 盟浪可持续数字科技(深圳)有限责任公司 一种多模态PDF版面结构分析系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。