买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:沈阳慧筑云科技有限公司
摘要:本发明属于数据处理技术领域,公开了一种基于用户合同习惯的合同模板智能生成方法,如下:获取用户历史合同文本数据集,并提取若干个第一关键词;通过分析用户历史合同文本中第一关键词,得到合同表达特征;根据合同表达特征分析合同结构特征参数;获取公开合同文本数据集,根据合同表达特征和合同结构特征参数计算公开合同文本的用户习惯相似度;根据用户习惯相似度优化聚类距离,以此对公开合同文本数据集进行聚类筛选,得到满足条件的公开合同文本;利用筛选的公开合同文本作为训练数据对预训练文本生成模型迁移学习训练。通过本发明筛选训练数据,对预训练文本生成模型进行迁移学习训练,使生成合同模板更符合用户需求,且提升合同生成效率。
主权项:1.一种基于用户合同习惯的合同模板智能生成方法,其特征在于:所述方法包括步骤如下:获取用户历史合同文本数据集,并从每份用户历史合同文本中提取得到若干个第一关键词;通过分析每份用户历史合同文本中提取的第一关键词,得到每个第一关键词对应在用户历史合同文本中表示用户历史合同习惯的合同表达特征;根据每份用户历史合同文本中各个第一关键词的合同表达特征分析表示用户历史合同习惯的合同结构特征参数;获取公开合同文本数据集,并根据合同表达特征和合同结构特征参数计算公开合同文本的用户习惯相似度;根据用户习惯相似度优化聚类距离,以此对公开合同文本数据集进行聚类筛选,得到满足条件的公开合同文本;利用筛选得到的公开合同文本作为训练数据对预训练文本生成模型进行迁移学习训练;所述第一关键词的获取,包括:利用LDA算法提取用户历史合同文本中关键词,并记为第一关键词;通过分析每份用户历史合同文本中提取的第一关键词,得到每个第一关键词对应在用户历史合同文本中表示用户历史合同习惯的合同表达特征,包括:将每份用户历史合同分为多个条款文本区间;计算各条款文本区间每个第一关键词的数量的均值;计算其他第一关键词的数量在每个条款文本区间的占比;根据得到第一关键词的数量的均值与其他第一关键词的数量在每个条款文本区间的占比进行计算,对计算的结果进行极差标准化,得到每个第一关键词对应在用户历史合同文本中表示用户历史合同习惯的合同表达特征;所述根据每份用户历史合同文本中各个第一关键词的合同表达特征,分析表示用户历史合同习惯的合同结构特征参数,包括:根据用户历史合同文本中每个第一关键词的合同表达特征,计算得到每个条款文本区间中每个第一关键词出现的第一加权次数均值;计算用户历史合同文本中所有第一关键词出现的第二加权次数均值;计算第一加权次数均值与第二加权次数均值之间的差值;对差值进行平方放大处理后,对用户历史合同文本中各个条款文本区间的差值进行平均处理,得到表示每份用户历史合同习惯的合同结构特征参数。
全文数据:
权利要求:
百度查询: 沈阳慧筑云科技有限公司 一种基于用户合同习惯的合同模板智能生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。