一种基于大模型的搜索问答方法

导航：龙图腾网> 最新专利技术> 一种基于大模型的搜索问答方法

申请/专利权人：天讯瑞达通信技术有限公司

申请日：2023-11-08

公开（公告）日：2024-06-25

公开（公告）号：CN117609444B

主分类号：G06F16/332

分类号：G06F16/332;G06F16/33;G06F16/35;G06F16/36;G06F18/214;G06F18/241

优先权：

专利状态码：有效-授权

法律状态：2024.06.25#授权;2024.03.15#实质审查的生效;2024.02.27#公开

摘要：本发明公开了一种基于大模型的搜索问答方法，涉及自然语言处理技术领域。方法包括步骤：获取知识信息；根据知识信息制作指令微调数据集，通过指令微调数据集对大模型进行微调训练，提高问答模型的精度和准确性；将知识信息入库，并根据知识信息对大模型进行训练；将用户输入问题处理为第一prompt文本；对第一prompt文本进行LangChain检索得到相似度；若相似度大于第一相似度阈值，则获取答案，提高问复速度；若相似度小于第一相似度阈值，则根据坐席困惑摘要、Topk知识信息和预设大模型prompt模板生成第三prompt文本，将第三prompt文本输入大模型得到答案，提高搜索问答的准确率和效率。

主权项：1.一种基于大模型的搜索问答方法，其特征在于：包括步骤：S1、获取知识信息；S2、根据知识信息制作指令微调数据集，通过指令微调数据集对大模型进行微调训练；S3、通过LangChain将知识信息入库，并根据知识信息对大模型进行Embedding训练；S4、接收用户输入问题，将用户输入问题处理为第一prompt文本；S5、对第一prompt文本进行LangChain检索得到相似度；若相似度大于第一相似度阈值，则获取答案，结束流程；若相似度小于第一相似度阈值，则进入步骤S6；S6、根据第一prompt文本和历史信息文本获取坐席困惑摘要，根据第一prompt文本和坐席困惑摘要获取LangChain中的Topk知识信息，根据所述坐席困惑摘要、Topk知识信息和预设大模型prompt模板生成第三prompt文本，将第三prompt文本输入大模型得到答案；步骤S1还包括：对知识信息进行数据清洗；所述数据清洗包括删除异常数据；所述异常数据包括带有网址的条目和短文本，以及带有特殊符号、电话号码或时间戳的内容；所述根据第一prompt文本和历史信息文本获取坐席困惑摘要，具体为：获取坐席与用户通话的历史信息文本，根据历史信息文本和第一prompt文本生成第二prompt文本，将第二prompt文本输入大模型获取坐席困惑摘要；步骤S2，具体包括步骤：设计样本prompt，将所述知识信息通过样本prompt输入指令语言模型得到指令微调数据集；根据所述指令微调数据集和模型微调方法对大模型进行微调训练；所述模型微调方法为Freeze方法、P-Tuning方法或Lora方法；步骤S3包括步骤：S31、通过预设规则对知识信息进行分段得到语块段落；S32、获取相似问数据库的数据，使用实体关系抽取模型将所述语块段落和相似问数据库的数据处理为训练数据集，使用训练数据集对大模型进行Embedding训练；所述训练数据集包括相似数据集和非相似数据集；所述相似问数据库是指在搜索问答系统中，存储了与用户问题相似或相关的已有问题的数据库；相似问数据库包含大量高频问题的样本数据，用来进行问题相似度匹配和搜索答案；步骤S31，具体为：通过知识信息的文本子标题进行分段得到若干段落；判断每个段落的段落长度；如果段落长度大于分段阈值，则将句号、问号和叹号作为切分点选取不大于分段阈值个字的片段作为一个语块段落；步骤S4，具体包括步骤：计算用户输入问题的长度，通过分类器获取用户输入问题的业务类型；若所述长度小于第一长度阈值，则匹配所述业务类型的高频问题模板，根据高频问题模板对用户输入问题进行补充作为第一prompt文本；若所述长度大于第一长度阈值，则根据业务类型获取业务实体类型，根据用户输入问题、业务类型和业务实体类型生成第一prompt文本；所述基于大模型的搜索问答方法，还包括步骤：S7、根据用户满意度对大模型进行反馈强化训练；具体包括步骤：S71、通过监督学习训练大模型；S72、对大模型的输出答案进行人工标注，并设计奖励模型；S73、大模型根据奖励模型和PPO算法进行强化训练；所述对大模型进行反馈强化训练，具体为使用Deepspeed-MII库对大模型进行反馈强化训练；所述使用Deepspeed-MII库对大模型进行反馈强化训练，包括：使用8位或4位的量化方式进行大模型量化；使用张量并行技术加速大模型在多GPU上的推理；通过网络剪枝去除不重要的模型权重或连接，以减小模型大小且保持模型容量；通过批量处理一次性加载大模型的模型参数，使用模型参数处理多个输入序列；通过全分片数据并行分布式策略使用多个GPU设备执行推理。

全文数据：

权利要求：

百度查询：天讯瑞达通信技术有限公司一种基于大模型的搜索问答方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种建筑施工用抹灰装置

下一篇：一种墙面保护用裁边边压片

相关技术

一种建筑施工用抹灰装置

一种墙面保护用裁边边压片

铠甲式轮胎保护链

一种电动汽车用新能源节能充电桩

一种工具携行包

一种基于防潮功能的变频器控制箱

一种护理液调和储存罐

一种用于储水桶的多重密封结构

一种具有固定结构的快客杯

一种具有分级过滤功能的纳滤膜元件

用于车辆顶板的显示装置和车辆

一种便于移动的展开式箱房

问答相关技术

问答结果溯源方法、装置、设备、介质及程序产品_中国电子技术标准化研究院_202410303716.2

无负担问答式c-VEP身份识别方法_福州大学_202111609672.9

一种特种设备维护问答系统的中文分词方法_四川省特种设备检验研究院_202410334443.8

一种基于语义识别的在线问答方法、系统和存储介质_国投人力资源服务有限公司_202410011779.0

问答知识的提取方法、提取装置与计算机可读存储介质_北京捷通华声科技股份有限公司_202010615397.0

基于跨模态提示学习的视频问答方法与系统_湖南大学_202210510047.7

基于大语言模型的问答方法、装置、电子设备及存储介质_中国电子技术标准化研究院_202410295644.1

基于大模型的垂直领域的问答方法及系统_甄觉科技(上海)有限公司_202410299787.X

一种基于物联网时序数据的问答预测系统及方法_南京智鹤电子科技有限公司_202410461035.9

基于双向注意力机制的智能问答方法、装置、设备及介质_平安科技(深圳)有限公司_202111272538.4

模型相关技术

电池模型校准_瑞维安知识产权控股有限责任公司_202311046344.1

决策树模型的模型隐私、数据隐私及模型一致性保护方法_南开大学_202311115522.1

模型调整方法及其装置_维沃移动通信有限公司_202410356220.1

一种展示模型_微山县土地资源事务服务中心_202322685404.6

建筑信息模型BIM模型数据处理方法、装置、电子设备和存储介质_江苏国贸酝领智能科技股份有限公司_202410310514.0

一种基于病理大模型的目标检测模型构建方法_北京透彻未来科技有限公司_202410428564.9

大语言模型的训练方法、利用大语言模型生成代码的方法_上海数中科技有限公司_202410370582.6

三维模型生成方法以及三维模型生成装置_松下知识产权经营株式会社_202280076021.4

OSAHS识别方法、模型、模型建立方法、及装置_孙书军_202110563785.3

基于水声物理模型的闭环自监督深度学习模型训练方法_中国船舶集团有限公司第七一五研究所_202410133840.9

方法相关技术

编译方法、运行方法及相关产品_中科寒武纪科技股份有限公司_202211700640.4

参数控制方法以及曝光方法_上海交通大学_202410383008.4

测试单元及形成方法、测试结构及形成方法、测试方法_中芯国际集成电路制造(上海)有限公司_202211698757.3

预测模型生成方法、预测方法、设备和介质_博泰车联网科技(上海)股份有限公司_202211724925.1

水文模型结构诊断方法、径流预报方法及装置_武汉大学_202111312143.2

掩模图像生成方法、检查方法以及检查装置_日立安斯泰莫株式会社_202280076511.4

分类模型训练方法以及分类方法_腾讯科技(深圳)有限公司_202210102315.1

获取方法、训练方法、任务处理方法及相关装置_浙江大华技术股份有限公司_202410693597.6

建模方法及利用该建模方法的多类目标签的目标检测方法_小红书科技有限公司_202211695489.X

铁水的制造方法_杰富意钢铁株式会社_202280076058.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于大模型的搜索问答方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务