首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种贸易合同关键内容的跨行合并方法 

申请/专利权人:深圳前海环融联易信息科技服务有限公司

申请日:2021-10-22

公开(公告)日:2024-04-26

公开(公告)号:CN113962217B

主分类号:G06F40/284

分类号:G06F40/284;G06F40/237;G06V30/148

优先权:

专利状态码:有效-授权

法律状态:2024.04.26#授权;2022.02.15#实质审查的生效;2022.01.21#公开

摘要:本发明公开一种贸易合同关键内容的跨行合并方法,包括以下步骤:输入文本图片,通过OCR技术依次识别出所述文本图片中每一行的文本内容,分别记为句子S1、句子S2…句子Sn,并进行分词;计算句子S1、句子S2…句子Sn在语料库中出现的概率pS1、pS2…pSn的值,句子S1与句子S2、句子S2与句子S3、…句子Sn‑1与句子Sn合并后的pS1S2、pS2S3…pSn‑1Sn的值;判断句子S1与句子S2、句子S2与句子S3、…句子Sn‑1与句子Sn是否能进行合并,判断条件为logpSn‑1Sn=logpSn‑1+logpSn2;若满足条件,则可进行合并。本发明可快速准确的判断相邻两个句子能否进行合并,实现交易合同中的句子的自动跨行合并,准确性高。

主权项:1.一种贸易合同关键内容的跨行合并方法,其特征在于,包括以下步骤:S1:输入文本图片,通过OCR技术依次识别出所述文本图片中每一行的文本内容,分别记为句子S1、句子S2…句子Sn,并通过分词工具对所述句子S1、句子S2…句子Sn进行分词,并对特殊词进行标记;S2:分别计算句子S1、句子S2…句子Sn在语料库中出现的概率pS1、pS2…pSn的值,同时分别计算出句子S1与句子S2、句子S2与句子S3、…句子Sn-1与句子Sn合并后的pS1S2、pS2S3…pSn-1Sn的值;所述pS1、pS2…pSn、pS1S2、pS2S3…pSn-1Sn的计算方法相同;所述pSn=pw1*pw2|w1*pw3|w1w2…*pwi|wi-2wi-1;其中,w1、w2…wi分别为句子Sn中的第1个词、第2个词…第n个词,所述pw1为语料库中以w1为开头的频率;所述pw2|w1=Cw1w2Cw1,所述Cw1w2表示字符串w1w2在语料库中出现的次数,所述Cw1为词语w1在语料库中出现的次数;所述pwi|wi-2wi-1=Cwi,wi-2wi-1Cwi-2wi-1,所述Cwi-2wi-1为字符串wi-2wi-1在语料库中出现的次数,所述Cwi,wi-2wi-1为wi以wi、wi-2wi-1的顺序排布时在语料库中出现的次数,所述pw3|w1w2的计算方法与pwi|wi-2wi-1的计算方法相同;S3:根据步骤S2的计算结果,依次判断句子S1与句子S2、句子S2与句子S3、…句子Sn-1与句子Sn是否能进行合并,判断条件为logpSn-1Sn=logpSn-1+logpSn2;S4:若满足条件,则将句子S1与句子S2进行合并、句子S2与句子S3进行合并、…、句子Sn-1与句子Sn进行合并。

全文数据:

权利要求:

百度查询: 深圳前海环融联易信息科技服务有限公司 一种贸易合同关键内容的跨行合并方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。