北京衔远有限公司苏珂获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京衔远有限公司申请的专利知识库的自动构建方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118312577B 。
龙图腾网通过国家知识产权局官网在2025-03-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410362068.8,技术领域涉及:G06F16/31;该发明授权知识库的自动构建方法、装置、电子设备及存储介质是由苏珂;田庆祥;齐弼卿设计研发完成,并于2024-03-27向国家知识产权局提交的专利申请。
本知识库的自动构建方法、装置、电子设备及存储介质在说明书摘要公布了:本申请涉及人工智能技术领域,提供了一种知识库的自动构建方法、装置、电子设备及存储介质。该方法包括:在大语言模型中,通过大语言模型的对话系统获取初始文本;当初始文本为非问答对形式时,利用预先构造的第一提示模版对初始文本进行清洗,得到第一可用文本;利用预先构造的第二提示模版对第一可用文本进行结构化知识提取,得到构建知识库所需的初始信息;利用预先构造的第三提示模板对初始信息进行知识融合和校验,得到目标信息,并基于目标信息构建知识库。本申请解决了现有技术中知识库的构建成本较高的问题。
本发明授权知识库的自动构建方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种知识库的自动构建方法,其特征在于,包括:在大语言模型中,通过所述大语言模型的对话系统获取初始文本;当所述初始文本为非问答对形式时,利用预先在所述大语言模型中构造的第一提示模版对所述初始文本进行清洗,得到第一可用文本;所述利用预先在所述大语言模型中构造的第一提示模版对所述初始文本进行清洗,得到第一可用文本,包括:利用所述第一提示模板对所述初始文本中的垃圾信息进行识别,并过滤所述垃圾信息,所述垃圾信息包括乱码、表情、超文本标签以及超过预设个数的连续标点符号;利用所述第一提示模板对所述初始文本进行语法判断,并对错误语法进行矫正;利用所述第一提示模板对所述初始文本进行内容重复判断,若存在重复内容,则保留所述重复内容中初次出现的内容;通过所述第一提示模板执行清洗步骤,得到所述第一可用文本;利用预先在所述大语言模型中构造的第二提示模版对所述第一可用文本进行结构化知识提取,得到构建知识库所需的初始信息;所述利用预先在所述大语言模型中构造的第二提示模版对所述第一可用文本进行结构化知识提取,得到构建知识库所需的初始信息,包括:利用所述第二提示模版对所述第一可用文本进行语义理解、实体分类、实体识别、关系提取、实体链接以及关系消歧处理,得到所述初始信息,所述初始信息包括三元组;利用预先在所述大语言模型中构造的第三提示模板对所述初始信息进行知识融合和校验,得到目标信息,并基于所述目标信息构建知识库;所述利用预先在所述大语言模型中构造的第三提示模板对所述初始信息进行知识融合和校验,得到目标信息,包括:利用所述第三提示模板对每串所述三元组中相同的实体进行冲突解决,得到解决后的初始信息;对所述解决后的初始信息进行可信性验证,得到可信度分数超过阈值的所述目标信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京衔远有限公司,其通讯地址为:100080 北京市海淀区颐和园路2号未来科技大厦主楼4层410;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。