Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜深度(山东)数字科技集团有限公司魏建华获国家专利权

恭喜深度(山东)数字科技集团有限公司魏建华获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜深度(山东)数字科技集团有限公司申请的专利一种用于构建多源数据分析流程的系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119202353B

龙图腾网通过国家知识产权局官网在2025-05-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411697129.2,技术领域涉及:G06F16/951;该发明授权一种用于构建多源数据分析流程的系统及方法是由魏建华;章松杨;赵梓杰;李方祥;孙奕为设计研发完成,并于2024-11-26向国家知识产权局提交的专利申请。

一种用于构建多源数据分析流程的系统及方法在说明书摘要公布了:本发明公开了一种用于构建多源数据分析流程的系统及方法,涉及多源数据分析优化技术领域,该方法包括以下步骤:基于互联网进行多源数据采集,包括网页数据抓取、社交媒体数据采集、公共数据库数据摘取,通过建立多源分析数据库;根据用户输入的关键词,基于多源分析数据库匹配关联数据,对于相关数据进行关联度分析,基于关联度进行降序排列,优先展示关联度高的匹配数据;对匹配的相关数据进行类别划分,结合首次展示的内容以及用户的后续操作。本发明通过对用户输入的关键词进行释义分类,结合多源分析数据库获得关联数据并结合释义类别进行标记,同时基于用户的访问行为对展示数据进行动态调整,增强了实用性与功能性。

本发明授权一种用于构建多源数据分析流程的系统及方法在权利要求书中公布了:1.一种用于构建多源数据分析流程的方法,其特征在于,该方法包括以下步骤:S1、基于互联网进行多源数据采集,包括网页数据抓取、社交媒体数据采集、公共数据库数据摘取,通过MySQL建立多源分析数据库;S2、根据用户输入的关键词,基于多源分析数据库匹配关联数据,对于相关数据进行关联度分析,基于关联度进行降序排列,优先展示关联度高的匹配数据;S3、对匹配的相关数据进行类别划分,结合首次展示的内容以及用户的后续操作,对未展示的匹配数据进行展示策略优化,对展示内容进行动态调整;S31、根据用户的每次关键词搜索,基于MySQL建立展示数据库,针对多源分析数据库中用户关键词匹配的关联数据,结合关键词的释义以及关联数据的内容,对关联数据进行类别划分,在展示数据库中建立类别档案,将同一类的关联数据匹配至同一个档案中;S311、对多源分析数据库中基于用户关键词匹配的关联数据,结合关键词的释义,对获得的关联数据内容分析关键词的对应释义,对获得的关联数据进行释义类别划分,确定不同关联数据的释义类别归属,其具体的步骤为:通过WordNet对用户输入的关键词进行检索,获得当前关键词对应的一个或多个同义词集,每个同义词集均包括关键词相应概念的释义内容,包括关联词以及释义描述;通过TF-IDF算法,对用户关键词匹配的关联数据进行文本关键词提取,其具体的步骤为: 其中,N为文档总数,即关联数据的总数,|{d∈D:t∈d}|代表包含词t的文档数,基于TFt,d与IDFt,D计算获得TF-IDFt,d,D:TF-IDFt,d,D=TFt,d×IDFt,D;基于TF-IDF值的高低提取出当前文档排名n的单词作为当前文档的关键词;S312、通过余弦相似度计算关联数据中提取的关键词向量和用户关键词每个释义对应的向量集合的相似度,以确定当前关联数据的类别,其步骤为:通过GloVe将关联数据中提取的关键词以及用户关键词转换为固定维度的向量,计算余弦相似度,其算法公式为: 其中,v1、v2分别代表关联数据中提取的关键词向量以及用户关键词向量,δv1,v2代表不同释义下的余弦相似度;基于相似度阈值θ,当某一释义关键词下的δv1,v2>θ,则代表当前关联数据属于当前释义类别;S32、针对首次基于关联度匹配展示的数据,结合用户的访问行为以及匹配数据的类别,对后续展示的内容进行动态调整;S321、统计优先展示的数据总数,同时获得用户的访问行为,对用户点击的关联数据以及用户未访问的关联数据进行分开标记;S322、根据不同用户行为标记的关联数据,结合类别档案,确定标记的关联数据类别,对后续展示内容进行动态调整;S3221、针对用户访问的关联数据,结合类别档案,对访问的关联数据进行类别追溯,确定访问的关联数据类别,并对当前类别进行绿色标记;S3222、针对用户未访问的关联数据,结合类别档案,对未访问的关联数据进行类别追溯,确定未访问的关联数据类别,并对当前类别进行红色标记;S3223、对未进行标记的类别档案进行黄色标记,对后续展示内容进行动态调节,其具体的步骤为:对原始关联度降序排列进行筛除,将原始关联度降序排列中的红色标记类别关联数据以及首次基于关联度匹配展示的数据进行剔除,对更新后的降序数列进行基于类别标记绿色黄色比例为6:4,进行关联数据提取,其具体的步骤为: 其中,s代表单次展示数据总数,q、r分别代表待提取绿色关联数据条数以及待提取黄色关联数据条数,在更新后的降序数列中,从绿色类别记录中按照关联度降序的顺序提取q条关联数据,从黄色类别记录中按照关联度降序顺序提取r条关联数据,进行展示;在每次用户结束当前页面的访问时,均对访问行为进行记录,对剩余绿色以及黄色标记类别结合当前用户的访问行为进行重新标记,对后续展示页面继续进行调整,基于用户的访问行为,对数据进行展示或剔除,逐渐缩小用户的访问范围。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深度(山东)数字科技集团有限公司,其通讯地址为:276000 山东省临沂市兰山区兰山街道商谷智慧产业园D10栋3层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。