首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种文书自动生成方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国电子科技集团公司第十五研究所

摘要:本发明公开了一种文书自动生成方法及系统。该方法包括:获取历史文书,对历史文书的正文部分采用深度学习方法进行命名实体识别,得到文书正文模板;对历史文书的头部和尾部采用正则表达式进行匹配,得到文书首尾模板;将文书正文模板和文书首尾模板合并为文书模板,将待填充的文书要素信息对应填充至所述文书正文模板和所述文书首尾模板中,生成文书。采用本发明的方法及系统,基于深度学习结合规则生成文书模板,让机器学习模板的要素规律,自动生成文书模板,能够有效避免传统模板难穷举、模板静态不灵活的问题,简化了操作过程,减少了文书编纂的耗时,能够有效提升文书生成的效率。

主权项:1.一种文书自动生成方法,其特征在于,包括:获取历史文书;对所述历史文书的正文部分采用深度学习方法进行命名实体识别,得到文书正文模板;对所述历史文书的头部和尾部采用正则表达式进行匹配,得到文书首尾模板;将所述文书正文模板和所述文书首尾模板合并为文书模板;所述文书模板用于生成文书;所述对所述历史文书的正文部分采用深度学习方法进行命名实体识别,得到文书正文模板,具体包括:将所述历史文书的正文部分输入BERT模型,得到输出的向量;将所述输出的向量输入训练好的BLSTM-CRF模型,得到标签;所述标签用于确定命名实体;所述训练好的BLSTM-CRF模型,训练过程具体包括:获取待训练的文书正文;将所述待训练的文书正文输入BERT模型,得到待训练的向量;以所述待训练的向量为输入,以与所述待训练的文书正文对应的标签为输出对所述BLSTM-CRF模型进行训练,得到训练好的BLSTM-CRF模型;所述将所述待训练的文书正文输入BERT模型,得到待训练的向量,具体包括:对所述待训练的文书正文进行分字处理,得到分字处理后的文本,具体为,利用单词字典将每个字转换为对应的索引,单词字典是采用WordPiece算法来进行构建的;在所述待训练的文书正文的每个句子的开始位置和结束位置添加标记信息,得到多个带有标记信息的句子;采用Transformer编码对所述分字处理后的文本和所述带有标记信息的句子进行处理,得到待训练的向量。

全文数据:

权利要求:

百度查询: 中国电子科技集团公司第十五研究所 一种文书自动生成方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。