一种基于LLM大模型的数据挖掘及分析方法

导航：龙图腾网> 最新专利技术> 一种基于LLM大模型的数据挖掘及分析方法

申请/专利权人：索安赛数据(成都)有限公司

申请日：2024-03-19

公开（公告）日：2024-06-18

公开（公告）号：CN118210914A

主分类号：G06F16/335

分类号：G06F16/335;G06F16/36;G06F16/332;G06Q50/20

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.07.05#实质审查的生效;2024.06.18#公开

摘要：本发明公开了一种基于LLM大模型的数据挖掘及分析方法，大语言模型可以根据研究人员的关键词、主题或问题，从图书馆知识库中检索出相关文献，包括图书、期刊论文、会议论文等，还能根据摘要或全文内容对文献进行评估，筛选出最相关的资源，包含最新研究论文、顶级会议收录论文等并提交给研究人员，交互简单易上手，提示工程具有普遍性。通用型大语言模型可以应用于各个领域的文本分析，包括教育领域的访谈文本，它的推广也意味着可以广泛应用于不同的教育研究和实践场景；同时，自然语言指令的交互方式使分析过程更加直观和对用户友好，每一个人都可以借鉴这套提示工程框架指导大语言模型个性化地执行私人文本分析任务。

主权项：1.一种基于LLM大模型的数据挖掘及分析方法，其特征在于：S1：大语言模型可以根据研究人员的关键词、主题或问题，从图书馆知识库中检索出相关文献，包括图书、期刊论文、会议论文等，还能根据摘要或全文内容对文献进行评估，筛选出最相关的资源，包含最新研究论文、顶级会议收录论文等并提交给研究人员；S2：大语言模型固有的泛化性和通用性使其可以跨域融合数据资源并快速抽取生成个性化和定制化的多场景部署应用，助力构建安全高效且低成本赋能各行各业的覆盖算力、平台、模型等多维度的生态图谱，涌现能力是通用人工智能照进现实世界的一缕曙光，意味着在一些多步骤的复杂任务中当模型规模超过某个临界阈值之时，任务效果会出现爆发式增长，不同于传统业务场景中使用明确代码表达程序执行逻辑的任务方式，具备涌现能力的大语言模型能够在不更新参数的情况下，只需在输入少量带有标注的数据之后表达预期目标，生成式模型就可以自行找出解决方法；S3：通过信息采集及信息预处理子系统构建的科技知识库，根据数据特征对不同类型数据选择不同方式进行持久化存储；经由知识抽取技术从科技大数据中构建科技领域知识图谱，并基于知识图谱实现对异构科技资源的语义关联，支撑特定技术的多维度综合分析；在技术分析阶段，系统针对用户设置的主题，结合网络挖掘、机器学习等方法建立的评估模型，对技术点进行综合评估，并根据数据更新自动同步分析结果；S4：基于LLMs的预测和规划工具，结合微调、语义嵌入等方式，可以整合诸如负荷模型、季节性变化、特殊事件和行为模式等多种因素，以精确预测未来负荷需求，基于Transformer架构的深度学习能力使基于LLMs的预测和规划工具能够捕捉复杂数据模式，从而提供高精度的预测，设计智能体有效利用预测数据，通过模拟不同运行场景，为电力系统的可持续发展提供策略支持；S5：大语言模型可以从大量文献资料中分析某一领域的研究现状、趋势以及未来发展方向，以帮助研究者了解研究热点并作出有针对性的研究计划，根据用户画像和资源元数据分析的结果，利用推荐算法匹配用户兴趣点和相关资源，推荐算法可以采用协同过滤、矩阵分解等算法，或综合多种算法形成混合推荐，根据推荐算法的结果，生成个性化的推荐资源清单，并将推荐资源以清单或摘要的形式展示给用户；同时，收集用户对推荐结果的反馈，用以不断优化算法和提高推荐精度。

全文数据：

权利要求：

百度查询：索安赛数据(成都)有限公司一种基于LLM大模型的数据挖掘及分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种无纺布绑袋

下一篇：一种便于移动的展开式箱房

相关技术

一种无纺布绑袋

一种便于移动的展开式箱房

一种人造花定印装置

一种微型制冷压缩机

一种高弹性一体编织鞋面

一种电表排母接口测量装置

一种可控制持握角度的羽毛球拍

一种装配式铝方通转角拼接结构

一种升降式饺子加工压面机

一种带液晶显示屏可调速的墙体切割机

一种带支架的手把及设有该手把的行李箱

一种监测作物生长状况的农业装置

方法相关技术

编译方法、运行方法及相关产品_中科寒武纪科技股份有限公司_202211700640.4

参数控制方法以及曝光方法_上海交通大学_202410383008.4

测试单元及形成方法、测试结构及形成方法、测试方法_中芯国际集成电路制造(上海)有限公司_202211698757.3

预测模型生成方法、预测方法、设备和介质_博泰车联网科技(上海)股份有限公司_202211724925.1

水文模型结构诊断方法、径流预报方法及装置_武汉大学_202111312143.2

掩模图像生成方法、检查方法以及检查装置_日立安斯泰莫株式会社_202280076511.4

分类模型训练方法以及分类方法_腾讯科技(深圳)有限公司_202210102315.1

获取方法、训练方法、任务处理方法及相关装置_浙江大华技术股份有限公司_202410693597.6

建模方法及利用该建模方法的多类目标签的目标检测方法_小红书科技有限公司_202211695489.X

片间通信方法_中科寒武纪科技股份有限公司_202211681198.5

模型相关技术

电池模型校准_瑞维安知识产权控股有限责任公司_202311046344.1

决策树模型的模型隐私、数据隐私及模型一致性保护方法_南开大学_202311115522.1

模型调整方法及其装置_维沃移动通信有限公司_202410356220.1

一种展示模型_微山县土地资源事务服务中心_202322685404.6

一种基于病理大模型的目标检测模型构建方法_北京透彻未来科技有限公司_202410428564.9

大语言模型的训练方法、利用大语言模型生成代码的方法_上海数中科技有限公司_202410370582.6

建筑信息模型BIM模型数据处理方法、装置、电子设备和存储介质_江苏国贸酝领智能科技股份有限公司_202410310514.0

三维模型生成方法以及三维模型生成装置_松下知识产权经营株式会社_202280076021.4

OSAHS识别方法、模型、模型建立方法、及装置_孙书军_202110563785.3

模型编码、模型推理方法、装置、电子设备和存储介质_上海壁仞科技股份有限公司_202410397719.7

分析相关技术

用于血液分析的试剂、血液分析方法及血液分析系统_深圳迈瑞生物医疗电子股份有限公司_202211690028.3

光谱分析_英国质谱公司_202011308789.9

样本分析仪_深圳迈瑞生物医疗电子股份有限公司_202311850581.3

基于情感分析的乳腺癌化疗患者症状分析系统及方法_吉林大学_202410650810.5

成像分析数据处理方法以及成像分析数据处理装置_株式会社岛津制作所_202011411547.2

一种基于报表多维分析的数据可视化分析平台_河钢数字技术股份有限公司_202211644259.0

骨髓液的分析方法、试样分析装置及计算机程序_希森美康株式会社_202311720180.6

对医疗数据进行分析的方法、训练模型的方法及分析仪_推想医疗科技股份有限公司_202110688013.2

基于图像分析的电力工程项目现场质量分析方法及系统_国网安徽省电力有限公司宿州供电公司_202111122395.9

生物体试料分析装置、生物体试料分析方法_株式会社日立高新技术_201980100290.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于LLM大模型的数据挖掘及分析方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务