首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于企业数据的数据库存储优化方法、系统及介质 

申请/专利权人:江西展群科技有限公司

申请日:2024-05-30

公开(公告)日:2024-06-28

公开(公告)号:CN118260273A

主分类号:G06F16/21

分类号:G06F16/21;G06N5/02;G06F16/36;G06F16/335;G06N3/0464;G06F16/45

优先权:

专利状态码:在审-公开

法律状态:2024.06.28#公开

摘要:本发明公开了一种基于企业数据的数据库存储优化方法、系统及介质,通过电商企业数据库中获取用户电商大数据,并进行预处理和语义数据提取,形成三元组数据集。然后,将三元组数据集与用户映射,通过聚类分析形成多个用户组。接着,基于聚类结果构建用户知识图谱并存储于数据库中。最后,根据目标用户的实时查询文本进行语义分析和数据检索,获取相关关联数据。本发明能够有效实现基于知识图谱的数据搭建、存储、查询数据的效率优化和满足数据库查询关联数据的需求。

主权项:1.一种基于企业数据的数据库存储优化方法,其特征在于,包括:从电商企业数据库中获取用户电商大数据,所述用户电商大数据包括用户的电商行为数据、基础数据、历史推荐数据;对电商大数据进行数据预处理并导入基于CNN的语义分析模型进行语义数据提取,语义数据提取包括实体、属性、关系三元组的信息提取,并形成三元组数据集;将三元组数据集与用户形成映射关系,以用户作为聚类单位,将三元组数据集导入预设聚类模型进行聚类分析,并通过聚类结果对用户进行分组,形成N个用户组;基于聚类结果与三元组数据集获取N组三元数据,通过N组三元数据构建N个用户知识图谱,并将N个用户知识图谱以图结构形式存储于电商企业数据库中;获取目标用户的实时查询文本,基于所述实时查询文本进行语义分析与关键词提取,得到搜索关键词,基于搜索关键词生成检索实体信息,在目标用户所对应用户知识图谱中进行数据检索,并得到检索关联数据;其中,所述对电商大数据进行数据预处理并导入基于CNN的语义分析模型进行语义数据提取,语义数据提取包括实体、属性、关系三元组的信息提取,并形成三元组数据集,具体为:构建基于CNN的语义分析模型;对电商大数据进行数据清洗、标准化预处理;以用户作为分析单位,将预处理后的电商大数据进行数据导入语义分析模型进行文本语义分析与提取,分析维度包括实体、属性、关系,将提取得到的三元组信息进行统计记录,形成三元组数据集;三元组数据集包括每个用户对应的三元组数据;其中,所述将三元组数据集与用户形成映射关系,以用户作为聚类单位,将三元组数据集导入预设聚类模型进行聚类分析,并通过聚类结果对用户进行分组,形成N个用户组,具体为:在三元组数据集中,将对应的三元组数据与用户信息进行关联映射,形成映射关系;以用户作为聚类单位,将三元组数据集中每个用户的三元组数据进行基于词向量模型的语义特征分析与特征提取,得到每个用户的语义特征数据;构建基于Kmeans的聚类模型,将所有语义特征数据导入聚类模型进行聚类分析,得到聚类结果;基于聚类结果与映射关系,对用户进行分组,形成N个用户组。

全文数据:

权利要求:

百度查询: 江西展群科技有限公司 一种基于企业数据的数据库存储优化方法、系统及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。