恭喜北京智谱华章科技有限公司张笑涵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京智谱华章科技有限公司申请的专利基于预训练语言模型的零微调拟人会话生成方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114780694B 。
龙图腾网通过国家知识产权局官网在2025-06-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210315679.8,技术领域涉及:G06F16/3329;该发明授权基于预训练语言模型的零微调拟人会话生成方法及设备是由张笑涵;于济凡设计研发完成,并于2022-03-28向国家知识产权局提交的专利申请。
本基于预训练语言模型的零微调拟人会话生成方法及设备在说明书摘要公布了:本发明提出一种基于预训练语言模型的零微调拟人会话生成方法及设备,该方法基于给定的描述领域的关键词,获取所述关键词的相关语料,并进行概念集扩展,聚合资源以提供相关知识资源;基于用户会话历史,选取其中与所述关键词相关的会话轮次,对所述会话轮次中的对话进行概念抽取,基于抽取结果得到的概念从知识资源库中寻找相关资源,将所述会话轮次文本以及所述资源拼接整合构建引导语,作为大规模预训练语言模型的输入,输出结果为对应会话轮次的对话回复。通过本发明,能够自动构建适合多轮拟真对话的大模型引导语模板,基于大模型生成得到对话结果。
本发明授权基于预训练语言模型的零微调拟人会话生成方法及设备在权利要求书中公布了:1.一种基于预训练语言模型的零微调拟人会话生成方法,其特征在于,包括: 基于给定的描述领域的关键词,获取所述关键词的相关语料,并进行概念集扩展,聚合资源以提供相关知识资源,包括:将所述关键词作为种子概念,从外部知识图谱中获取种子概念相关的概念描述和知识资源,同时获取种子概念相关的概念描述和知识资源对应的文本内容,得到关键词对应的资源数据;将收集到的资源数据进行格式标准化;其中,标准化格式包括问答对形式和文本描述形式;对格式标准化的资源数据进行数据拓展,作为所述资源数据的拓展候选集合;对所述拓展候选集合进行聚类,以聚类结果为单位,与所述种子概念进行相似度计算,完成概念排序; 基于用户会话历史,选取其中与所述关键词相关的会话轮次,对所述会话轮次中的对话进行概念抽取,基于抽取结果得到的概念从知识资源库中寻找相关资源,将所述会话轮次文本以及所述资源拼接整合构建引导语,作为大规模预训练语言模型的输入,输出结果为对应会话轮次的对话回复,包括:根据当前用户输入轮次作为查询从整个会话历史中挑选出k个相关对话轮次,作为输入基础;对作为输入基础的k个相关对话轮次进行概念抽取,并基于抽取结果得到的概念从知识资源库中寻找相关对话型资源,补充在对应的会话轮次;将多轮对话历史作为整体,从知识库中查找最相关的概念,并将其描述型资源插入在聊天之前,作为对话背景知识;使用大规模预训练语言模型,将得到的整体对话作为输入,使用BeamSearch方式生成当轮对话回复。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京智谱华章科技有限公司,其通讯地址为:100084 北京市海淀区中关村东路1号院6号楼6层603A;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。