首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于LLM大模型的数据挖掘及分析方法 

申请/专利权人:索安赛数据(成都)有限公司

申请日:2024-03-19

公开(公告)日:2024-06-18

公开(公告)号:CN118210914A

主分类号:G06F16/335

分类号:G06F16/335;G06F16/36;G06F16/332;G06Q50/20

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.07.05#实质审查的生效;2024.06.18#公开

摘要:本发明公开了一种基于LLM大模型的数据挖掘及分析方法,大语言模型可以根据研究人员的关键词、主题或问题,从图书馆知识库中检索出相关文献,包括图书、期刊论文、会议论文等,还能根据摘要或全文内容对文献进行评估,筛选出最相关的资源,包含最新研究论文、顶级会议收录论文等并提交给研究人员,交互简单易上手,提示工程具有普遍性。通用型大语言模型可以应用于各个领域的文本分析,包括教育领域的访谈文本,它的推广也意味着可以广泛应用于不同的教育研究和实践场景;同时,自然语言指令的交互方式使分析过程更加直观和对用户友好,每一个人都可以借鉴这套提示工程框架指导大语言模型个性化地执行私人文本分析任务。

主权项:1.一种基于LLM大模型的数据挖掘及分析方法,其特征在于:S1:大语言模型可以根据研究人员的关键词、主题或问题,从图书馆知识库中检索出相关文献,包括图书、期刊论文、会议论文等,还能根据摘要或全文内容对文献进行评估,筛选出最相关的资源,包含最新研究论文、顶级会议收录论文等并提交给研究人员;S2:大语言模型固有的泛化性和通用性使其可以跨域融合数据资源并快速抽取生成个性化和定制化的多场景部署应用,助力构建安全高效且低成本赋能各行各业的覆盖算力、平台、模型等多维度的生态图谱,涌现能力是通用人工智能照进现实世界的一缕曙光,意味着在一些多步骤的复杂任务中当模型规模超过某个临界阈值之时,任务效果会出现爆发式增长,不同于传统业务场景中使用明确代码表达程序执行逻辑的任务方式,具备涌现能力的大语言模型能够在不更新参数的情况下,只需在输入少量带有标注的数据之后表达预期目标,生成式模型就可以自行找出解决方法;S3:通过信息采集及信息预处理子系统构建的科技知识库,根据数据特征对不同类型数据选择不同方式进行持久化存储;经由知识抽取技术从科技大数据中构建科技领域知识图谱,并基于知识图谱实现对异构科技资源的语义关联,支撑特定技术的多维度综合分析;在技术分析阶段,系统针对用户设置的主题,结合网络挖掘、机器学习等方法建立的评估模型,对技术点进行综合评估,并根据数据更新自动同步分析结果;S4:基于LLMs的预测和规划工具,结合微调、语义嵌入等方式,可以整合诸如负荷模型、季节性变化、特殊事件和行为模式等多种因素,以精确预测未来负荷需求,基于Transformer架构的深度学习能力使基于LLMs的预测和规划工具能够捕捉复杂数据模式,从而提供高精度的预测,设计智能体有效利用预测数据,通过模拟不同运行场景,为电力系统的可持续发展提供策略支持;S5:大语言模型可以从大量文献资料中分析某一领域的研究现状、趋势以及未来发展方向,以帮助研究者了解研究热点并作出有针对性的研究计划,根据用户画像和资源元数据分析的结果,利用推荐算法匹配用户兴趣点和相关资源,推荐算法可以采用协同过滤、矩阵分解等算法,或综合多种算法形成混合推荐,根据推荐算法的结果,生成个性化的推荐资源清单,并将推荐资源以清单或摘要的形式展示给用户;同时,收集用户对推荐结果的反馈,用以不断优化算法和提高推荐精度。

全文数据:

权利要求:

百度查询: 索安赛数据(成都)有限公司 一种基于LLM大模型的数据挖掘及分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。