首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种铁路行业智能问答助手系统_武汉铁路职业技术学院_202311623844.7 

申请/专利权人:武汉铁路职业技术学院

申请日:2023-11-30

公开(公告)日:2024-06-21

公开(公告)号:CN117633179B

主分类号:G06F16/332

分类号:G06F16/332;G06F16/33;G06F16/31;G06N5/022;G06N5/04

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2024.05.07#实质审查的生效;2024.03.01#公开

摘要:本发明公开了一种铁路行业智能问答助手系统,涉及自然语言处理领域,包括:行业大模型指令微调模块收集铁路行业相关知识作为铁路行业指令问答数据集,利用超大规模语言模型Qwen‑7b模型对指令问答数据集进行微调创建出用于自动收集铁路行业相关知识的智能助手;行业知识向量库构建模块通过智能助手内指令问答数据集发出的指令获取知识文档,对知识文档进行格式与文本裁剪的解析处理,使用向量数据库存储;问题检索模块根据用户提出的问题从向量数据库内提取与问题内容匹配的文本内容;答案生成模块将文本内容代入大语言模型LLM中,得出基于文本内容的回答。本发明采用大模型技术能够快速生成答案实现智能化效果。

主权项:1.一种铁路行业智能问答助手系统,其特征在于,包括:行业大模型指令微调模块,行业知识向量库构建模块,问题检索模块,答案生成模块;所述行业大模型指令微调模块,用于收集铁路行业相关知识作为铁路行业指令问答数据集,利用超大规模语言模型Qwen-7b模型对指令问答数据集进行微调创建出用于自动收集铁路行业相关知识的智能助手;所述行业大模型指令微调模块包括数据清洗单元和模型微调单元,所述数据清洗单元,具体用于收集筛选指令数据:行业知识库问答数据、政策问答数据、基于self-instruct方法生成指令数据、通用指令数据;所述模型微调单元,具体用于采用超大规模语言模型Qwen-7b模型作为基座模型,对模型进行微调训练;所述对指令问答数据集进行微调时,将问答数据拼接成如下格式:sinput1starget1sinput2starget2s;其中,input1为第一输入数据,target1为第一目标数据,input2为第二输入数据,target2为第二目标数据,s为结束标识符;所述行业知识向量库构建模块,用于通过智能助手内指令问答数据集发出的指令获取知识文档,对知识文档进行格式与文本裁剪的解析处理,使用向量数据库存储;所述问题检索模块,用于根据用户提出的问题从向量数据库内提取与问题内容匹配的文本内容;所述答案生成模块,用于将文本内容代入大语言模型LLM中,得出基于文本内容的回答。

全文数据:

权利要求:

百度查询: 武汉铁路职业技术学院 一种铁路行业智能问答助手系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。