【发明公布】一种应用于法律领域的基础大模型的优化方法_天津大学_202410339246.5

导航：龙图腾网> 最新专利技术> 一种应用于法律领域的基础大模型的优化方法_天津大学_202410339246.5

申请/专利权人：天津大学

申请日：2024-03-25

公开（公告）日：2024-06-07

公开（公告）号：CN118153714A

主分类号：G06N20/00

分类号：G06N20/00;G06Q50/18;G06F40/284;G06N5/022;G06F18/25

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.06.25#实质审查的生效;2024.06.07#公开

摘要：本发明公布一种应用于法律领域的基础大模型的优化方法。采用LangChain+Streamlit+城市安全大模型的方式进行本地化部署，提供智能应答服务。主要包括数据收集、处理数据、问答对知识召回优化、参数微调和模型优化。微调大模型可以提高模型在应对法律和城市安全领域的鲁棒性。通过向模型中添加新的任务和数据，模型可以更好地适应复杂多变的法律环境和城市安全挑战。根据具体应用场景对模型进行精简和优化，以保证模型在法律和城市安全领域的高效运行。

主权项：1.一种应用于法律领域的基础大模型的优化方法，其特征在于，采用LangChain+Streamlit+城市安全大模型的方式进行本地化部署，提供智能应答服务；包括如下步骤：S1数据收集S2处理数据：将收集的数据进行整理并进行预处理，包括进行数据筛选、数据清洗，进行构建知识库和进行知识召回，进一步构建问答对；知识库融合倒排索引与向量索引两种构建技术；采取高效冗余的多级召回机制；通过切分文档并行化处理，运用具备多节点弹性伸缩能力的向量模型，进行分布式并行推理运算，最后，采用KNN算法进行索引预热构建；S3问答对知识召回优化S4定义目标和策略：考虑进行部分微调，以及微调的层级和范围，同时考虑使用新增的数据集进行微调，使用RLHF-人类反馈强化学习来策略来完成微调过程；将微调任务表述为RL问题，该策略是一个接受提示并返回一系列文本或文本的概率分布的语言模LM，奖励函数RM是偏好模型和策略转变约束的结合；具体来说，这个策略模型能够根据已生成的部分序列x0，x1，...，xk-1，预测下一个文本单元xk的概率分布，其中0≤kn；设定词表为∑，则给定长度为n的序列x0，x1，...，xn-1的联合概率可以通过语言模型ρ表示为：ρx0…xn-1＝Π0≤knρxk|x0…xk-1其中，输入空间X定义为所有长度不超过m的文章集合，即X＝∑≤m，而输出空间Y是所有长度恰好为n的总结集合，即Y＝∑n；由文章x生成总结y的概率表示为首先，初始化策略为π＝ρ，然后使用PPO算法更新策略π，奖励函数定义为r，则奖励的期望值可以表示为：学习损失：将提示输入初始LM和当前微调的LM，分别得到输出文本，将来自当前策略的文本传递给RM得到一个标量的奖励，将两个模型的生成文本进行比较计算差异的损失函数，通常设计为输出词分布序列之间的KL散度的缩放，即：r＝rθ-βrKL其中这一项被用于惩罚RL策略在每个训练批次中生成大幅偏离初始模型，以避免模型过分偏离初始模型，从而保持模型输出的连贯性和合理性；S5参数微调训练：设置超参数，确定微调过程中的超参数；初始化模型参数，根据预训练模型的权重，初始化微调模型的参数；对于部分微调，只有顶层或少数层的参数会被随机初始化；进行微调训练，使用准备好的数据集和微调策略，对模型进行训练，在训练过程中，根据设定的超参数和优化算法，逐渐调整模型参数以最小化损失函数；S6模型调优在微调阶段结束后，利用独立的测试集对最终调整后的模型进行全面评估，采用稀疏微调方法来优化模型性能，设计一套参数索引集合及其与预训练值之间的增量数组，以实现所需的参数更新密度控制。

全文数据：

权利要求：

百度查询：天津大学一种应用于法律领域的基础大模型的优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：城市暴雨洪水管理模型参数自动率定方法及系统_武汉理工大学_202210061553.2

下一篇：一种新能源汽车配件生产定位钻孔装置_西安翔凌汽车零部件有限公司_202210366932.2

相关技术

城市暴雨洪水管理模型参数自动率定方法及系统_武汉理工大学_202210061553.2

一种新能源汽车配件生产定位钻孔装置_西安翔凌汽车零部件有限公司_202210366932.2

股骨头坏死植入支架_中国人民解放军联勤保障部队第九二〇医院_202410475083.3

一种4-环己基-3-(三氟甲基)苯甲醇的制备方法_浙江工业大学_202211411775.9

一种轻量非晶合金及其制备方法_东莞市逸昊金属材料科技有限公司_202211701845.4

一种弯管内壁自动行走激光堆焊增材设备_广东博盈特焊技术股份有限公司_202410354772.9

一种流量监测装置_成都锦城学院_202410425182.0

一种基于草料的饲料制造用粉碎方法_张向红_202210570360.X

一种间隔条浇灌胶质的装置_河南金拇指防水工程有限公司_202210302950.4

一种齿轮加工成型设备_兴化金马鹿机电科技有限公司_202410356685.7

一种可变任意尺寸模具的挤吹机及其挤吹工艺_晋江里弗兰新材料有限公司_202410445743.3

点云处理的方法、系统、电子设备及计算机可读存储介质_合众新能源汽车股份有限公司_202210573918.X

模型相关技术

一种规划模型_新疆创青晨环保科技有限公司_202322707294.9

模型预训练方法、模型训练方法、对象处理方法及装置_北京百度网讯科技有限公司_202310701200.9

模型更新方法、模型更新装置以及计算机存储介质_浙江大华技术股份有限公司_202410316236.X

模型增量训练方法、系统以及应用于日志异常检测的模型_深圳市溪数科技有限公司_202410119055.8

模型生成装置、模型生成方法及数据估计装置_株式会社力森诺科_202280075750.8

一种倾斜摄影模型与BIM模型比对分析的方法_中铁市政环境建设有限公司_202410432814.6

基于大模型技术的模型服务提供方法、平台及电子设备_北京百度网讯科技有限公司_202410324021.2

插拔式中间接头缺陷模型及模型的制作方法_青岛华电高压电气有限公司_201810541343.7

一种陶瓷房屋模型_福建省德化县杰宝陶瓷有限公司_202322594456.2

一种人体解剖手臂模型_许连静_202323026300.0

基础相关技术

一种隧底溶洞基础桩_中铁建大桥工程局集团第五工程有限公司_202323237482.6

一种风机基础的修复方法_中国电建集团西北勘测设计研究院有限公司_202211632313.X

桩基础组件和风力发电机组_江苏金风科技有限公司_202322460661.X

一种建筑基础施工扩底桩_阳山县腾晖建筑工程有限公司_202323177704.X

冻土区风电基础的防冻保护结构_中国电建集团华东勘测设计研究院有限公司_202323008957.4

一种光伏支架基础浇筑模具_元工电力技术有限公司_202323121388.4

一种建筑地基基础结构_中建八局第四建设有限公司_202410471468.2

一种杯型基础浇筑定位模具_浙江东横建筑工程有限公司_202323176374.2

计算机视觉基础模型的预训练_微软技术许可有限责任公司_202280072787.5

一种光伏基础配重浇筑预埋螺栓定位卡尺_鼎晟光伏能源有限公司_202323127377.7

领域相关技术

一种领域数据处理方法及装置_卓世智星(成都)科技有限公司_202410424968.0

一种融合领域推理规则的实体知识问答方法_中国电子科技集团公司第二十八研究所_202410420196.3

一种多领域虚假新闻读者认知检测方法_重庆理工大学_202311362348.0

用于独立于领域的术语链接的系统和方法_罗伯特·博世有限公司_201880090468.0

一种基于工具增强的财务领域智能问答方法_合肥大智慧财汇数据科技有限公司_202410635164.5

一种基于市政给排水领域的管道泵站_柴晓瑛_202322389799.5

视频会议领域基于多进程机制的服务容灾方法及其系统_上海赛连信息科技有限公司_202410525267.6

酶解装置及酶解方法、在胶原蛋白提取领域内的应用_河南中科干细胞基因工程有限公司_202410311599.4

一种垂直领域的大模型输入文本质量评价方法_北京信息科技大学_202410320141.5

一种基于基尼指数的领域自适应语义分割方法_北京工业大学_202010781502.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种应用于法律领域的基础大模型的优化方法_天津大学_202410339246.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务