首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

根据数据扩展自动填充表格产生表格数据的系统及方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江网盛数新软件股份有限公司

摘要:本发明公开了根据数据扩展自动填充表格产生表格数据的系统及方法,包括数据源接收模块、表格填充系统、数据监测模块和数据存储库,本发明涉及表格填充技术领域。该根据数据扩展自动填充表格产生表格数据的系统及方法,通过设置有表格填充系统,将数据源统一转换为文档格式,依据文档内容形成表格标题,并根据内容数据的结构和类型形成初始表格模版,再基于初始表格模版通过识别算法完成行标题和列标题的填充,完成行标题和列标题对应数据的匹配,实现表格数据的构件,从而完成对数据的统一化,并根据交叉定位法实现表格数据的填充,以此提高填充效率,使得表格数据更为规整,同时也提高了数据填充的准确性。

主权项:1.根据数据扩展自动填充表格产生表格数据的系统,其特征在于:包括:数据源接收模块,用于对所要生成表格数据的各项源头数据接收,包含图片、文档、录音或视频的数据源格式;表格填充系统,将数据源统一转换为文档格式,并通过对数据的匹配处理实现表格的构件操作,并形成表格数据反馈至数据库中存储,具体包括:数据获取模块,获取数据源初始数据后,完成对数据源格式的转换形成文档格式,并基于文档中的内容作出初步筛选,并传输至表格构件模块中处理;表格构件模块,依据文档内容形成表格标题,并根据内容数据的结构和类型形成初始表格模版,再基于初始表格模版通过识别算法完成行标题和列标题的填充,完成行标题和列标题对应数据的匹配,实现表格数据的构件;数据反馈模块,将形成的表格数据以所需的格式保存并向数据存储库传输;数据监测模块,用于监控数据源中的数据变动,并完成对表格数据的实时替换;数据存储库,将数据源、转换后的数据以及匹配形成的表格数据进行存储,便于计算机对于数据的追溯和使用;所述表格构件模块中完成行标题和列标题对应数据的匹配填充操作为:E1、基于填充有行标题和列标题的初始表格模版,将初始数据集M输入后依靠交叉定位法完成对数据的填充;E2、交叉定位法是位于任选一初始数据子集,先确定该初始数据子集的列标题位置,基于列标题位置上对初始数据子集中的行标题类型进行确定,而基于行标题类型的竖向表格路径中和列标题位置的横向表格路径中交叉单元格为对应数据内容的区域;E3、直至一个初始数据子集中的类别内容数据填充完成后切换至另一个初始数据子集进行识别填充,并再完成表格数据填充完成后,对于表格数据进行查验操作,并对于问题数据进行修复处理;所述E3中对表格数据进行查验、修复的操作为:e31、将表格数据中填充后的内容特征进行格式处理,完成字体、字号、字体颜色、对齐方式和边框的统一化操作;e32、通过对表格数据内容完成从左至右并依次切换至下一行的顺序进行遍历操作,查验表格内容中是否存在空值或错误数据类型;当存在有空值单元格时,依据空值单元格所处的行标题和列标题反馈至初始数据集M中进行数据追溯,若存在有数据内容则插入至空值单元格,若无对应数据内容,则跳过该空值单元格切换至下一个空值单元格检验;当存在有错误数据类型时,先确定位于错误数据类型的单元格竖向路径是否包含有其他的错误数据类型,将同一竖向路径中的错误数据类型对应的内容长度进行比对,选择最长的错误数据类型并标记为R,并根据该错误数据类型的列项单元格长度计算单元格需要扩展的长度,并完成单元格的扩展和数据内容的切换,且计算公式为:L=lR+2*lH-lS;其中,L为单元格需要扩展的长度,lR为错误数据类型的内容长度,lH为内容与单元格边界的相距长度,而H为留白距离,lS为最长错误数据类型所处单元格的初始长度,而S表示为最长错误数据类型多出的初始单元格;e33、将查验、修复完成的表格数据进行保存并转为所需格式进行传输。

全文数据:

权利要求:

百度查询: 浙江网盛数新软件股份有限公司 根据数据扩展自动填充表格产生表格数据的系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。