Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜上海冰鉴信息科技有限公司顾凌云获国家专利权

恭喜上海冰鉴信息科技有限公司顾凌云获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜上海冰鉴信息科技有限公司申请的专利一种基于组合树结构的文档段落内容合并切分方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119918505B

龙图腾网通过国家知识产权局官网在2025-06-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510413265.2,技术领域涉及:G06F40/14;该发明授权一种基于组合树结构的文档段落内容合并切分方法是由顾凌云;张涛;潘峻;吴嘉业;江峰设计研发完成,并于2025-04-03向国家知识产权局提交的专利申请。

一种基于组合树结构的文档段落内容合并切分方法在说明书摘要公布了:本申请设计了一种基于组合树结构的文档段落内容合并切分方法,包括:S1、利用文档解析工具获取文档内容;S2、逐行遍历文档内容,得到行文本内容列表secs;为每行内容分配标题层级,获取层级识别结果列表levels;S3、利用上述得到的行文本内容列表secs、层级识别结果列表levels和程序定义的处理深度depth,生成段落标题组织分组列表cks;S4、根据段落标题组织分组列表cks,将标题路径信息分组,构建段落标题信息组cks‑group;S5、将段落标题信息组cks‑group组织成内容结构树形式;S6、剪枝合并内容结构树,在更大的层级上合并文本内容;S7、处理剪枝后的内容结构树,生成当前文件的文档块内容。本申请能够高效地构建出语义丰富完整的待匹配文档块。

本发明授权一种基于组合树结构的文档段落内容合并切分方法在权利要求书中公布了:1.一种基于组合树结构的文档段落内容合并切分方法,其特征在于,包括以下步骤: 步骤S1、利用文档解析工具获取文档内容; 步骤S2、逐行遍历文档内容,得到行文本内容列表secs;为每行内容分配标题层级,获取层级识别结果列表levels; 步骤S3、利用步骤S2得到的行文本内容列表secs、层级识别结果列表levels和程序定义的处理深度depth,生成段落标题组织分组列表cks; 步骤S4、根据段落标题组织分组列表cks,将标题路径信息分组,构建段落标题信息组cks-group; 步骤S5、将段落标题信息组cks-group组织成内容结构树形式; 步骤S6、剪枝合并内容结构树,在更大的层级上合并文本内容; 步骤S7、处理剪枝后的内容结构树,生成当前文件的文档块内容; 所述步骤S3中,生成段落标题组织分组列表cks的方法包括: 步骤S31、将层级识别结果列表levels的内容反转,从最后一层级k+1层的文本开始进行行文本所属父级标题的识别; 步骤S32、遍历层级识别结果列表levels中的每个层级和层级内的每个行文本,直到层级达到指定的深度; 步骤S33、使用二分查找算法,在所有先前层级levels[li]中找到当前层级levels[lj]的行文本对应的父级标题段落;并将当前行文本的次序ridi,以及父级标题段落对应的文本次序ridk合成元组(ridk,ridi),加入到段落标题组织分组列表cks中,并对段落标题组织分组列表cks进行初始化; 步骤S34、对比段落标题组织分组列表cks中记录的行文本和行文本内容列表secs中的内容,找到尚未处理的行文本; 步骤S35、对于每一个未处理的行文本,利用二分查找算法,确定其所属父级标题,填充进段落标题组织分组列表cks中。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海冰鉴信息科技有限公司,其通讯地址为:200120 上海市浦东新区自由贸易试验区商城路618号四层B207室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。