一种基于大语言模型的检索方法、设备及介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：浙江锦智人工智能科技有限公司

摘要：本申请公开了一种基于大语言模型的检索方法、设备及介质，方法包括：确定训练数据，对训练数据进行预处理，并对预处理后的训练数据进行格式转换，以使训练数据的格式为对话结构；对训练数据进行划分，以得到训练集、验证集和测试集，确定预先设置的语言模型，根据划分后的训练数据对语言模型进行模型训练；确定语言模型的超参数，根据超参数对语言模型进行调整，以对语言模型进行优化；通过优化后的语言模型进行检索，以得到检索结果。本申请通过大语言模型的应用，提高对自然语言查询的理解能力，能够更深入地理解用户的查询意图和语义，从而改善搜索结果的精准度和全面性。

主权项：1.一种基于大语言模型的检索方法，其特征在于，包括：确定训练数据，对所述训练数据进行预处理，并对预处理后的所述训练数据进行格式转换，以使所述训练数据的格式为对话结构；对所述训练数据进行划分，以得到训练集、验证集和测试集，确定预先设置的语言模型，根据划分后的所述训练数据对所述语言模型进行模型训练；对所述语言模型进行模型训练，具体包括：根据预先设置的所述语言模型确定模型任务，根据所述模型任务对所述语言模型进行结构调整，以得到模型输出层；确定所述语言模型的模型参数，根据所述模型参数对所述模型输出层进行修改；确定多个所述模型输出层，在多个所述模型输出层中确定预先设置的冻结层，根据所述冻结层确定更新层，并根据所述模型任务对所述更新层对应的所述模型进行更新；确定所述语言模型的超参数，根据所述超参数对所述语言模型进行调整，以对所述语言模型进行优化；通过优化后的所述语言模型进行检索，以得到检索结果；所述超参数包括但不限于学习率、批次、迭代次数；对所述语言模型进行优化之前，所述方法还包括：确定所述语言模型的模型收敛速度、损失曲线平滑度、验证及性能，根据所述模型收敛速度、所述损失曲线平滑度、所述验证集性能对所述学习率进行调整；确定所述语言模型的硬件显存和模型复杂度，根据所述硬件显存和所述模型复杂度确定所述批次的大小；确定所述语言模型的训练周期数，根据所述训练周期数确定所述迭代次数；根据所述验证集确定所述语言模型的错误案例，并根据所述错误案例确定所述语言模型的准确率和召回率；根据所述准确率和所述召回率确定所述语言模型的指标分数，以根据所述指标分数确定所述语言模型的评估等级；通过优化后的所述语言模型进行检索之前，所述方法还包括：通过所述语言模型获取语音信息，对所述语音信息进行格式转换，以得到文本信息，通过所述语言模型确定所述文本信息对应的键值对；根据所述键值对将所述文本信息进行储存，以得到历史查询信息；确定预先设置的过期程序，根据所述过期程序对所述历史查询信息进行更新；将所述训练数据整理成适配模型输入的多轮对话数据格式，多轮对话数据格式的每一轮都包含对话ID、发言者和内容；用户的每一次提问都建立在前面对话内容的基础上；所述语言模型通过考虑上下文信息，并根据用户的问题提供相关的回答；对所述语言模型进行结构调整，跟据预先选择的微调任务，设计与所述微调任务匹配的模型输出层；选择正则化技术减少过拟合，在所述语言模型的隐藏层添加Dropout层，设定Dropout比例；Dropout层在每次前向传播时随机丢弃部分神经元输出；以键-值对的形式存储用户每一次文本信息中的地理信息，作为历史查询信息，其中会话ID作为键，将模型每一次根据文本信息生成的地理信息、关联信息和维度统计信息构成键对应的值；同时，系统设定了时间过期策略，定期对缓存进行清理和维护，以确保最新的历史查询信息能够及时添加到缓存中；在用户发起查询请求时，系统首先检查历史缓存。

全文数据：

权利要求：

百度查询：浙江锦智人工智能科技有限公司一种基于大语言模型的检索方法、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种消化内科催吐装置

下一篇：一种铅碳电池用改性多孔炭的制备方法及铅碳电池

相关技术

一种消化内科催吐装置

一种铅碳电池用改性多孔炭的制备方法及铅碳电池

一种有效微生物群活性菌剂及其应用方法

一种组合式固定件依附锁定器

逆变器动态功率解耦控制方法及装置

基于区域人体感应的通风柜控制方法及系统

一种飞机复合材料部件超规范修理专家系统

一种注册终端设备的方法及装置

性别判定模型的生成方法、装置、电子设备及介质

一种靶向铜绿假单胞菌凝集素的仿生多功能纳米制剂及其制备方法和应用

快速滤波器校准方法

一种应用于水利水电地下洞室高薄岩墙开挖方法

方法相关技术

煤的评价方法和混煤的制备方法以及焦炭的制造方法_杰富意钢铁株式会社_202080019357.8

蚀刻方法_株式会社力森诺科_202280091493.7

图像检测方法、模型训练方法及相关装置_马上消费金融股份有限公司_202410202420.1

测试结构、失效定位方法以及失效分析方法_上海华力微电子有限公司_202410692646.4

资源配置方法、资源发送方法、资源测量方法及电子设备_成都爱瑞无线科技有限公司_202411141003.7

动态密钥生成方法、升级包加密方法、软件升级方法_广汽埃安新能源汽车股份有限公司_202410720762.2

界面显示方法、视频发布方法、视频编辑方法及装置_北京达佳互联信息技术有限公司_202210945497.9

搬运方法_浜松光子学株式会社_202410706496.8

检测装置、检测方法、鞋垫、训练方法和识别方法_宁波荣勃通机电科技有限公司_202110935805.5

造型物及其制造方法、造型数据的创建方法_京洛株式会社_202380018929.4

设备相关技术

显示设备和包括该显示设备的计算设备_乐金显示有限公司_202210245458.8

多设备的控制方法、主设备及从设备_广州视源电子科技股份有限公司_202310248719.6

导向设备、直线电机及加工设备_苏州维嘉科技股份有限公司_202310265507.9

电子设备及可穿戴设备_OPPO广东移动通信有限公司_202011148777.4

显示设备_三星显示有限公司_202410306296.3

检测设备_珠海科创储能科技有限公司_202323641434.3

测试设备_广东聚华新型显示研究院_202323294429.X

显示设备_三星显示有限公司_202110404317.1

镀膜设备_深圳市捷佳伟创新能源装备股份有限公司_202410887533.X

显示设备_达擎股份有限公司_202310250329.2

模型相关技术

一种积分模型_晋中职业技术学院_202420672550.7

建筑信息模型管理系统_南通职业大学_202410946875.4

模型推理方法及装置_上海壁仞科技股份有限公司_202410980431.2

一种模型测试方法、装置和用于模型测试的装置_北京搜狗科技发展有限公司_202110688290.3

三维人脸几何模型、人脸彩色模型的构建方法、装置_西安科技大学_202210927602.6

基于BERT模型的医学应用模型训练方法及装置_北京诺道认知医学科技有限公司_202011159163.6

一种判别式语言模型的模型调整方法及装置_清华大学_202210567681.4

图像生成模型、图像生成模型的训练方法及装置_维沃移动通信有限公司_202410812014.7

一种基于生成模型与判别分类模型的图像半监督分类方法_南通大学_202210855415.1

模型设定支援装置、模型设定支援方法及存储介质_本田技研工业株式会社_202410204794.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于大语言模型的检索方法、设备及介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务