买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中航信移动科技有限公司
摘要:本发明涉及大语言模型领域,特别是涉及一种基于融合信息的大模型输出生成方法、介质及设备。包括:若存在任意问答参考记录中还包括行程查询标记,则获取行程信息;按照相似度对多个问答参考信息进行排序拼接,生成初始参考信息;将行程信息与初始参考信息拼接,生成次级参考信息;将初始输入及次级参考信息进行拼接后,生成第二目标输入;将第二目标输入加载至目标领域对应的专用大语言模型中,以生成对应的输出。本发明中根据行程查询标记,来确定想要获取的答案为更加准确的信息。由此通过是否携带有行程查询标记,来确定要将第一目标输入加载至专用大语言模型还是通用大语言模型中。以克服大语言模型的“幻觉”问题,对用户的影响。
主权项:1.一种基于融合信息的大模型输出生成方法,其特征在于,所述方法包括如下步骤:使用初始输入分别与目标领域中的多个类别的外部知识库进行匹配,以召回多个类别的外部知识库分别对应的问答参考记录;所述问答参考记录包括:问答参考信息及置信度;所述外部知识库包括长文本知识库、短文本知识库、结构化数据知识库及意图知识库;若存在任意问答参考记录中还包括行程查询标记,则获取初始输入对应用户的行程信息;所述行程查询标记表示对应问答参考记录中问答参考信息中答案部分的内容,与用户的行程信息中的至少一个字段对应的值相关;使用目标相似度计算模型,生成初始输入分别与每一问答参考信息对应的句向量之间的相似度;所述目标相似度计算模型为基于SimCSE框架使用目标领域对应的语料训练过的RoBERTa模型;按照相似度由大到小的顺序,对多个问答参考信息进行排序拼接,生成初始参考信息;将所述行程信息与所述初始参考信息拼接,生成次级参考信息;将初始输入及次级参考信息进行拼接后,生成第二目标输入;将所述第二目标输入加载至所述目标领域对应的专用大语言模型中,以生成对应的输出;所述专用大语言模型为使用目标领域对应的语料对通用大语言模型进行训练得到的。
全文数据:
权利要求:
百度查询: 中航信移动科技有限公司 一种基于融合信息的大模型输出生成方法、介质及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。