首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种面向智能问诊系统的复述句生成优化方法_杭州师范大学_202011457520.7 

申请/专利权人:杭州师范大学

申请日:2020-12-10

公开(公告)日:2024-05-28

公开(公告)号:CN112397201B

主分类号:G16H50/20

分类号:G16H50/20;G06F16/332;G06F40/211;G06F40/289;G06F18/23213;G06F18/22;G06N3/049;G06N3/08;G06N3/0464

优先权:

专利状态码:有效-授权

法律状态:2024.05.28#授权;2021.03.12#实质审查的生效;2021.02.23#公开

摘要:本发明公开了一种面向智能问诊系统的复述句生成优化方法,对中文问诊语料库进行文本聚类,从而获得复述语料库,然后分别抽取待复述句子和复述语料库中的句子模板,再将待复述句子模板与复述模板组进行模板匹配和句子生成,从而获得一个候选生成句集合,最后利用RNN‑LM模型和基于相似与相异信息的CNN模型计算候选生成句的综合相似度得分,从而在候选生成句集合中获得最佳复述生成句。

主权项:1.一种面向智能问诊系统的复述句生成优化方法,其特征在于,包括步骤:A选择以问答对形式存在且问句长度有限的问答数据集,其中问句不包含标点符号以及修饰限定成分;B对所述问答数据集进行文本聚类,将语义相似的问句归属于同一簇中;C对所有问句进行句式精简和模板抽取,获得相应的复述模板,其中,一个所述簇里的所有复述模板作为一个复述模板组;对待复述句进行相同的句式精简和模板抽取,获得待复述句模板;所述句式精简和模板抽取的具体步骤包括:C-1使用jieba组件对每个句子进行分词、词性标注和命名实体识别处理,同时保持原句中词语的顺序不变,然后将句子中相应的词语分别替换为词性标注标签和命名实体标签,形成初步的句子模板;C-2将特殊功能词替换为特殊功能词标签,对所述初步的句子模板进行更新,获得新的句式模板;C-3利用句法分析建立句法树,剔除不影响句子主体的修饰关系部分,从而精简句式,获得相应的复述模板;D抽取待复述句模板与所有复述模板组进行检索匹配,如果在某个复述模板组中找到了与所述待复述句模板相同的复述模板,则表明该复述模板组中所有复述模板都有被改写成新的复述句的可能,根据匹配到的复述模板组里的所有复述模板,分别生成不同的复述生成句;E将所有复述生成句根据综合相似度进行排序,按照排序选择综合相似度最高的作为最佳复述生成句。

全文数据:

权利要求:

百度查询: 杭州师范大学 一种面向智能问诊系统的复述句生成优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。